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本 书 针对 近年 来 电子 与 通信 技术 的 发 展 对 嵌入 式 系统 的 需求 ， 从 总 体 
上 介绍 了 和 嵌 人 式 系统 的 设计 模式 与 方法 ， 从 系统 的 规范 与 建 模 、 和 骨 人 式 硬 
件 、 嵌 入 式 操作 系统 、 系 统 的 评估 与 验证 、 应 用 程序 的 实现 与 优化 等 方 
面 ， 对 信息 一 物理 系统 的 艇 入 式 设计 进行 了 讲述 。 透 过 本 书 , 读者 可 以 学 
习 到 更 多 关于 艇 人 式 领 域 的 前 沿 知识 与 设计 方法 ， 也 可 以 进一步 观 固 嵌入 
式 系统 知识 。 本 书 对 工程 实践 也 有 着 较 强 的 指导 意义 。 

本 书 可 以 作为 工程 师 的 伐 人 式 学 习 资料 ， 也 可 以 作为 本 科 、 硕 士 和 研 
究 人 员 的 参考 书 ， 对 当前 的 课程 教学 能 起 到 很 好 的 补充 作用 。 
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译 者 序 


随 着 电子 技术 、 通 信 技 术 等 的 飞速 发 展 ， 嵌 入 式 系 统 已 经 广泛 地 应 用 在 工业 控 
制 、 通 信 、 航 空 航天 、 消 费 电子 产品 等 领域 ,其 所 带 来 的 价值 不 可 估量 。 随 着 时 间 
推移 ， 褒 入 式 系统 的 需求 量 呈 现 指 数 增长 ， 并 上 且 应 用 范围 不 断 扩大 ， 同 时 对 系统 的 
复杂 性 、 稳 定性 、 安 全 性 以 及 关键 性 的 要 求 也 日 益 提高 。 谋 入 式 系统 如 何 满足 这 种 
需求 ， 怎 样 提高 吝 入 式 软件 的 开发 效率 ， 怎 样 以 最 短 的 时 间 开 发 出 最 令 人 满意 的 、 
高 效 可 靠 的 嵌入 式 软 件 成 为 了 摆 在 人 们 面前 的 问题 。 

本 书 以 全 面 而 整体 的 视角 ， 重 新 审视 嵌入 式 系统 ， 全 面 总 结 了 内 入 式 系 统 中 常 
见 的 以 及 关键 的 设计 模式 及 设计 方法 。 这 些 模 式 及 方法 广泛 应 用 于 嵌入 式 系统 或 训 
入 式 软件 中 。 本 书 还 提出 了 很 多 新 颖 的 设计 模式 ， 为 嵌入 式 系 统 开发 者 提供 了 强 有 
力 的 工具 。 通 过 这 些 模式 ， 开 发 者 可 以 用 最 短 的 时 间 设 计 出 性 能 好 、 稳 定性 强 、 安 
全 性 高 的 嵌入 式 系统 或 软件 ， 而 且 也 能 为 系统 日 后 的 升级 维护 打下 坚实 的 设计 基 
础 。 读 者 能 够 从 本 书 系 统 地 掌握 嵌入 式 系 统 的 设计 模式 进行 系统 的 开发 。 本 书 针 对 
嵌入 式 系统 中 从 硬件 设计 到 操作 系统 选择 、 方 案 的 评估 及 验证 、 应 用 程序 的 验证 、 
系统 的 优化 及 测试 出 发 ， 对 嵌入 式 系统 设计 方面 的 知识 进行 了 详细 阔 述 ， 本 书 的 读 
者 可 以 从 这 些 设计 原则 中 进行 良好 的 襄 入 式 架构 设计 。 

诚然 ， 本 书 不 是 一 本 简 简 单单 的 工程 类 书籍 ， 读 完 本 书后 某 些 方法 并 不 能 马上 
用 于 具体 的 工程 实践 中 ,但 是 本 书 所 介绍 的 嵌入 式 开 发 恩 想 却 时 时 刻 刻 影响 着 所 有 
阅读 过 本 书 的 嵌入 式 开 发 人 员 。 

本 书 在 翻译 的 过 程 中 得 到 了 很 多 人 的 帮助 和 鼓励 ， 在 此 感谢 机 械 工业 出 版 社 纺 
辑 在 本 书 翻译 过 程 中 给 予 的 帮助 ， 还 要 感谢 李兵 、 李 华 、 黄 志 登 、 杨 建华 、 王 耀 、 
xb. BR. FER, MR, BR. REA, AMAR KA, WIR, TE, RA 
梅 等 人 对 本 书 部 分 内 容 翻译 方面 给 予 的 指导 以 及 对 本 书 部 分 内 容 的 翻译 。 由 于 时 间 
关系 ， 虽 然 尽 最 大 的 努力 翻译 ， 但 是 译文 中 难免 有 芯 漏 和 错误 之 处 ， 尽 请 读者 批评 
指正 。 
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定义 与 范围 


直到 20 世纪 80 年 代 末期 ， 信 息 处 理 仍 然 依 赖 于 大 型 计算 机 及 海量 的 磁带 式 存 
储 介质 。 在 90 年 代 ， 信 息 处 理 开始 转向 使 用 个 人 计算 机 (PC)。 随 着 产品 小 型 化 
趋势 的 发 展 ， 大 多 数 的 信息 处 理 设备 将 使 用 小 型 的 便携 式 计算 机 ， 大 型 产品 将 集成 
多 个 信息 处 理 设备 。PC 上 的 信息 处 理 较 常见 ， 但 其 实 信息 处 理 也 存在 于 多 种 大 型 
产品 中 ， 如 电信 设备 。 一 般 来 讲 ， 科技 产品 必须 以 先进 的 技术 来 吸引 顾客 。 在 科技 
发 达 国 家 的 汽车 、 摄 像 机 、 电 视 机 、 手 机 等 领域 ， 如 果 产 品 中 没有 吝 入 式 计算 机 ， 
产品 将 很 难 畅 销 。 基于 此 ， 并 根据 一 些 预 测 (参见 [National Research Council, 
2001]), ， 信 息 与 通信 技术 (Information and Communication Technologies, ICT) 的 未 
来 特征 可 以 用 如 下 的 一 些 术语 来 概括 ; 

1) 普及 计算 [Weiser， 2003 | ; 

2) 普 适 计算 [ Hansmann, 2001], [ Burkhardt, 2001 ] ; 

3) 环境 智能 [Koninklijke Philips Electronics N. V. , 2003] , [ Marzano and Aar- 
ts, 2003]; 

4) 消失 的 计算 机 [Weiser，2003] ; 

5) 后 PC 时 代 。 

术语 1 与 2 都 反映 了 计算 (与 通信 ) 无 处 不 在 的 事实 ， 信息 将 随时 随地 触手 
可 及 。 这 些 关 于 未 来 的 预测 ， 也 包括 我 们 的 日 常生 活 将 进入 普遍 计算 的 时 代 。 作 为 
环境 智能 ， 它 们 的 重点 之 一 就 是 未 来 的 智能 建筑 。 其 实 术 语 1 ~3 仅 有 些许 的 差异 : 
普 适 计算 侧重 于 无 时 无 处 不 在 的 信息 分 享 ; 普及 计算 侧重 于 如 何 对 现 有 信息 进行 利 
用 。 术 语 4 表 明了 处 理 器 与 软件 将 更 广泛 地 应 用 于 很 多 小 系统 中 ， 很 多 时 候 它们 都 
不 是 直接 可 见 的 。 术 语 “ 后 PC 时 代 ” ( Post- PC era) 则 是 指 硬件 平台 中 基于 标准 
架构 的 PC 将 会 减少 。 

FR ICT 系统 需要 两 项 关键 技术 : 

1) 谱 入 式 系 统 (Embedded Systems) ; 

2) 通信 技术 (Communication Technologies ) 。 

图 0.1 展 示 了 嵌入 式 系统 与 通信 技术 如 何 影响 普 适 计算 。 

举例 来 说 ,一些 庶 入 式 的 普 适 计算 设备 ， 在 使 用 诸如 网 络 化 的 基本 通信 技术 
时 ， 必 须 满足 嵌入 式 系统 关于 实时 性 与 可 靠 性 的 要 求 。 除 部 分 章节 有 所 提 及 处 ， 关 
村 通信 技术 的 细节 并 不 在 本 书 的 讨论 范围 ， 读者 需要 另行 参考 其 他 著作 。 那么 ， 究 
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图 0.1 上 能 和信 式 系统 对 普 适 /普及 计算 的 影响 (© European Commission ) 
竟 什 么 是 “ 谈 入 式 系统 ”? 它们 可 以 有 如 下 定义 [Marwedel, 2003]; 
RA: 嵌入 式 系 统 是 集成 在 产品 中 的 信息 处 理 单元 。 


如 汽车 、 火 车 、 飞 机 、 电 信 及 制造 设备 等 包含 说 入 式 系 统 的 设备 ， 它 们 有 很 多 
共性 ， 如 对 实时 性 的 要 求 、 对 可 靠 性 以 及 效率 的 要 求 等 。 在 这 些 系统 中 ， 与 物理 环 
境 及 物理 系统 的 连接 尤为 重要 ， 下 面 的 引用 也 对 此 进行 了 强调 [Lee, 2006 ] : 

“网 入 式 软件 是 基于 物理 处 理 器 的 一 种 软件 ， 它 用 于 在 计算 系统 中 管理 时 间 和 与 
并 发 性 ”。 

以 上 引用 可 以 被 用 米 定 义 “ 谈 入 式 软件 ”这 一 术语 ， 如 果 将 其 中 的 “软件 ” 
换 成 “系统 ”， 它 也 可 以 扩展 为 对 嵌入 式 系 统 的 定义 。 如 果 加 以 强调 其 与 物理 系统 
的 连接 ， 则 可 以 引申 出 “信息 一 物理 系统 ”( Cyber- Physical System, CPS 或 cy- phy 
系统 )。cy-phy 系统 的 定义 如 下 : 


定义 :“ 人 和 信息 一 物理 系统 是 计算 与 物理 过 程 的 集成 ”[Lee，2007] 。 


这 个 新 的 术语 强调 了 诸如 时 间 、 能 量 、 空 间 与 物理 工程 的 关系 。 在 大 部 分 软件 
都 运行 在 PC 上 的 环境 中 ， 这 种 关系 常常 被 忽略 ， 那 么 现在 对 其 进行 强调 ， 就 有 着 
重要 的 工程 意义 。 对 于 信息 一 物理 系统 ， 在 系统 建 模 时 ， 需 要 同时 考虑 物理 环境 的 
模型 。 从 这 种 意义 上 讲 ， 可 以 将 信息 一 物理 系统 理解 为 嵌入 式 系 统 (信息 处 理 单 
元 ) 与 物理 环境 的 组 合 。 当 希望 强调 物理 与 环境 的 关系 时 ， 将 随时 引用 这 一 新 术 
语 。 在 未 来 ， 面 向 生物 与 化 学 的 连接 也 会 变 得 重要 。 

本 书 提供 了 信息 一 物理 系统 设计 中 的 重要 设计 概念 ， 履 盖 了 技术 规范 、 硬 件 组 
件 、 系 统 软 件 、 应 用 实现 、 仿 真 与 验证 、 典 型 系统 的 优化 以 及 测试 方法 。 
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嵌入 式 信息 一 物理 系统 的 重要 性 


睹 入 式 信息 一 物理 系统 被 认为 是 ICT 未 来 最 重要 的 应 用 领域 。 嵌 入 式 系 统 中 的 
处 理 器 数量 已 经 超过 了 PC， 这 种 趋势 仍 将 继续 。 据 此 ， 谈 入 式 软 件 的 数量 也 将 保 
持 增长 。 人 们 已 经 预言 了 新 的 摩尔 定律 : 消费 电子 产品 中 的 代码 量 每 两 年 将 会 翻 信 
| Vaandrager，1998 ] 。 训 入 式 系统 的 重要 性 不 断 增长 ， 它 甚至 影响 到 了 美国 国家 研 
究 委 员 会 的 一 份 报告 [National Research Council，2001 ] 。 该 报告 中 指出 , “信息 技 
A (Information Technology, IT) 正在 带 来 一 场 新 的 革命 … 嵌 入 式 计算 机 所 组 成 的 
网 络 … 依 靠 对 大 量 设备 与 传感器 的 连接 ， 它 将 很 有 可 能 从 根本 上 改变 人 们 与 环境 的 
相互 关系 ， 它 使 信息 以 前 所 未 有 的 方式 进行 收集 、 分 享 与 处 理 … 整 个 社会 将 因此 创 
造 一 个 新 的 里 程 碑 ”。 

关于 网 入 式 市 场 规模 的 统计 资料 ， 可 以 从 相关 的 网 站 上 查找 到 。 这 类 站 点 如 
“IT facts” [IT Facts, 2010], 它 分 析 了 嵌入 式 系 统 市 场 的 重要 性 。 也 可 以 从 另 一 
个 角度 看 待 谋 入 式 市 场 的 规模 ， 大 部 分 的 谋 入 式 处 理 器 都 是 8 位 处 理 器 ， 但 除 此 之 
外 ，32 位 处 理 器 也 正 被 大 量 使 用 到 底 入 式 系统 中 [ Stiller, 2000], - 1996 年 ， 
就 有 人 估算 说 每 个 美国 人 平均 每 天 要 接触 超过 60 种 微 处 理 器 [Camposano and 
Wolf，1996]。 一 些 高 端 汽车 上 装置 了 超过 100 种 微 处 理 器 G。 因 为 人 们 一 般 并 不 
会 意识 到 他 们 正在 使 用 微 处 理 器 ， 所 以 这 个 数据 其 实 比 典型 的 预 估 值 还 要 高 ， 关 于 
谈 入 式 系统 的 重要 性 ， 也 有 如 下 报道 [Ryan，1995] ; 

“工业 中 的 嵌入 式 芯片 驱动 着 我 们 所 生存 的 世界 的 发 展 … 它 们 是 基于 电力 工作 
的 系统 的 重要 部 分 ”。 

根据 多 项 预测 ， 嵌 入 式 系 统 的 市 场 将 在 未 来 远大 于 PC 一 类 的 市 场 。 美 国 国家 
科学 基金 会 一 直 在 资助 信息 一 物理 系统 的 研究 工作 [National Science Foundation , 
2010]。 在 欧洲 ， 第 六 、 第 七 框架 项 目 支持 嵌入 式 系统 的 研究 与 开发 [European 
Commission Cordis, 2010], ARTEMIS 联合 组 织 [ ARTEMIS Joint Undertaking , 
2010] 也 在 政府 与 公司 之 间 创 建 了 一 个 合作 研究 组 织 ， 从 而 推动 嵌入 式 计算 的 研 
究 与 开发 。 这 些 积极 的 行动 ， 都 证 实 了 欧洲 的 工业 界 对 此 领域 有 着 巨大 的 兴趣 。 当 
然 ， 在 其 他 的 国家 与 地 区 也 存在 着 类 似 的 组 织 。 

在 当前 的 很 多 课程 或 培训 中 ， 都 未 能 有 效 地 强调 嵌入 式 /信息 一 物理 系统 的 重 
要 性 。 本 书 的 写作 目的 就 是 要 改变 这 一 现象 ， 它 将 提供 学 习 误 入 式 /信息 一 物理 系 
统 的 第 一 课 。 因 此 ， 它 被 设计 为 教科 书 的 形式 。 但 它 又 比 一 般 的 教科 书 提供 了 更 多 
的 参考 ， 它 也 能 帮助 读者 丰富 关于 这 一 领域 的 信息 。 因此 ， 本 书 也 适用 于 教师 以 及 
工程 师 。 对 于 学 生 ， 本 书 提供 的 丰富 的 参考 资料 可 以 使 其 更 迅速 地 找到 相关 信息 。 
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本 书 的 读者 

本 书 适 合 于 以 下 4 类 读者 : 

1) 计算 机 科学 (CS) 、 计 算 机 工程 (CE)、 电 子 工程 (EE) 专业 的 学 生 以 及 
其 他 ICT 相关 专业 对 嵌入 式 /信息 一 物理 系统 有 所 研究 的 专业 学 生 。 本 书 适合 对 计 
算 机 软 、 硬 件 有 一 定 基 础 的 本 科大 三 以 上 学 生 阅 读 ， 即 适合 高 年 级 的 在 校生 阅读 。 
本 书 的 目的 之 一 ， 是 为 读者 在 以 后 的 课程 中 探索 更 深层 次 问题 铺 平 道路 。 本 书 假定 
读者 具备 一 些 计算 机 科学 的 知识 ， 因 此 电子 工程 专业 的 学 生 可 能 需要 去 阅读 一 些 补 
充 材料 ， 从 而 更 好 地 理解 本 书 的 内 容 。 事 实 上 ， 本 书 中 提 及 的 一 些 内 容 也 许 已 经 被 
电子 工程 专业 的 学 生 所 知晓 。 

2) 一 直 从 事 庶 入 式 硬件 但 希望 对 谈 入 式 软件 开发 也 有 所 涉猎 的 工程 师 。 本 书 
也 将 提供 很 多 的 背景 资料 以 使 读者 能 更 好 地 了 解 相关 的 出 版 物 。 

3) 在 集中 开展 特定 领域 的 研究 前 ， 项 望 快速 而 大 致 了 解说 入 式 系统 技术 中 的 
关键 概念 的 博士 研究 生 。 

4) 开 授 关于 嵌入 式 系统 的 新 课程 前 的 教师 。 


嵌入 式 系统 课程 的 整合 


不 幸 的 是 ， 在 最 近 由 ACM fo IEEE 计算 机 科学 [ ACM/IEEE, 2008] 出 版 的 最 
新 版 计算 机 科学 课程 中 ， 谋 入 式 系 统 并 没有 被 履 盖 到 。 但 是 ， 相 关 的 应 用 产品 的 增 
长 又 形成 了 对 此 类 课程 的 强烈 需求 。 本 书 将 帮助 读者 克服 当前 谋 入 式 系统 学 习 中 可 
利用 的 资源 较 少 的 限制 。 例 如 ， 对 更 好 的 规范 语言 、 模 式 、 工 具 生 成 、 时 序 验证 、 
系统 软件 、 实 时 操作 系统 、 低 功 耗 设计 技术 、 可 靠 性 设计 技术 等 的 需求 。 本 书 将 讲 
授 一 些 问题 的 要 点 ， 从 而 作为 读者 展开 相关 研究 的 第 一 步 。 


本 书 的 覆盖 范 图 


本 书 涵盖 了 嵌入 式 系 统 中 的 软件 与 硬件 ， 写 作出 发 点 可 以 以 如 下 的 话 来 解释 : 
“点 入 式 系统 的 开发 决 不 能 忽略 潜在 的 硬件 因素 。 时 序 、 内 存 使 用 、 功 耗 以 及 物理 
缺陷 都 很 重要 。” [Caspi et al. , 2005], 

本 书 侧重 于 硬件 与 软件 设计 中 的 基本 概念 ， 因 此 除非 某 些 工 具 与 产品 确实 不 同 
凡响 ， 否 则 本 书 不 会 对 其 进行 详细 介绍 。 这 在 ARTIT 中 也 可 以 解释 为 “如 果 一 开 
始 没有 商定 良好 的 理论 基础 ， 则 它们 在 今后 的 培训 中 将 更 难以 学 会 ， 然 而 这 些 理论 
又 是 我 们 必须 重视 的 ” [Caspi et al. , 2005], 本 书 通过 微 控制 器 编程 的 讲授 ， 来 
讲授 说 入 式 系统 的 设计 ， 我 们 希望 书 中 的 材料 不 会 很 快 过 时 ， 其 中 的 概念 在 未 来 多 
年 内 仍 将 有 指导 意义 。 

关于 计算 机 科学 与 工程 的 教科 书 ， 我 在 一 篇 论文 中 对 此 也 有 一 些 提议 [ Mar- 
wedel，2005 ] 。 本 书 的 一 个 重要 目标 ， 即 梳理 出 关于 嵌入 式 系 统 设计 中 重要 的 相关 
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课题 ， 并 且 讨 论 它们 之 间 的 联系 。 由 此 ， 可 以 避免 在 ARTIST 手册 中 提 及 的 一 个 问 
题 : “要 经 历 太 多 工业 实践 才能 迎 来 一 个 领域 的 成 熟 ， 这 通常 又 归 因 于 文化 。… 课 
程 … 对 于 那些 特别 强调 某 项 技术 的 课程 ， 它们 并 未 提供 足够 广泛 的 知识 面 。… 因 
此 ， 工 厂 经 常 难以 找到 训练 有 素 的 工程 师 ” [ Caspi et al. , 2005], 

本 书 也 是 微 控制 器 编程 实践 与 理论 知识 的 桥梁 。 更 进一步 地 ， 它 将 帮助 老师 与 
学 生 去 积极 获取 更 多 详细 资料 。 关 于 某 些 话题 ， 本 书 进行 了 详实 的 讨论 ， 某 些 只 作 
了 简要 概述 。 概 述 性 章节 的 引入 ， 是 为 了 引入 更 多 相关 的 问题 与 参考 。 这 种 方式 使 
教师 可 以 针对 其 所 需 在 本 书 中 进行 选择 ， 并 查阅 书 中 提 及 的 参考 资料 。 本 书包 含 了 
比 常规 教科 书 更 多 的 参考 内 容 ， 这 样 ， 本 书 可 以 作为 一 个 综合 向 导 ， 为 读者 在 进行 
其 他 资料 的 学 习 时 指明 方向 。 在 实验 室 、 项 目 以 及 独立 研究 中 ， 对 这 些 参考 资料 的 
研究 也 将 为 其 带 来 积极 作用 。 

关于 本 书 的 更 多 相关 资料 可 以 从 如 下 网 站 获得 : 

http: //ls12-www. cs. tu- dortmund. de/~marwedel/es- book 

网 页 包含 了 演示 ppt. GALA, 勘误 以 及 其 他 的 相关 材料 。 发 现 本 书 错 误 或 
项 望 评价 此 书 的 读者 可 以 发 送 邮件 至 ; 

peter. marwedel@ tu- dortmund. de 

在 完成 章节 练习 时 ， 可 以 参考 一 些 补充 内 容 (如 [ Wolf，2001 ] 、 [ Buttazzo ， 
2002] 和 [Gajski et al. , 2009 ] ) 。 


预备 知识 


阅读 本 书 需要 对 以 下 领域 有 基本 认识 ; 

1) 高 中 水 平 的 电气 知识 (如 基 尔 霍 夫 定律 ) ; 

2) AAKE (可 选 ) ; 

3) 计算 机 架构 ， 如 J.L. Hennessy 5 D. A. Patterson 相关 著作 的 初级 水 平 
[ Hennessy and Patterson, 2008 | ; 

4) 类 似 于 门 与 寄存 器 的 基本 数字 电路 知识 ; 

5) 计算 机 编程 〔 含 软件 工程 理论 ) ; 

6) 操作 系统 基础 ; 

7) 计算 机 网 络 基础 ; 

8) 有 限 状 态 机 ; 

9) 微 控 制 器 编程 的 基本 经 验 ; 

10) 基本 的 数学 概念 (如 数组 、 积 分 、 线 性 方程 ) ， 最 好 能 有 统计 学 及 侍 里 叶 
级 数 的 知识 ; 

11) 算法 〈 图 形 算法 、 优 化 算法 以 及 分 支 界限 ) ; 

12) NP- completeness 的 概念 。 

本 书 所 需 预备 知识 的 架构 如 图 0.2 所 示 。 
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图 0.2 本 书 知识 点 的 架构 


其 他 推荐 学 习 资 料 


使 用 本 书 作 教材 ， 最 好 有 专门 的 实验 室 ， 可 以 使 用 小 型 机 器 人 ， 如 Lego Mind- 
storms “或 相似 的 其 他 机 器 人 来 做 实验 。 可 选 地 ， 也 可 以 让 学 生 利用 有 限 状 态 机 的 
工具 来 进行 实际 操作 。 

以 下 领域 的 专业 课程 可 以 作为 本 书 的 补充 学 习 资 料 (参见 图 0.2 的 底 行 )9， 

1) 控制 系统 ; 

2) 数字 信号 处 理 ; 

3) 机 器 视觉 ; 

4) 实时 系统 、 实 时 操作 系统 与 调度 ; 

5) 中 间 件 ; 

6) 诸如 通信 、 汽 车 、 医 疗 设备 及 智能 家 居 等 应 用 领域 的 材料 ; 

7) 机 器 人 技术 ; 

8) 传感器 与 执行 机 构 ; 

9) 谱 入 式 系统 的 特定 语言 ; 

10) 特定 应 用 的 计算 机 辅助 设备 工具 ; 

11) 硬件 系统 的 常规 验证 ; 

12) 硬件 与 软件 系统 测试 ; 

13) 计算 机 系统 的 性 能 评估 ; 

14) 低 功 耗 设 计 技 术 ; 

15) 计算 机 系统 的 安全 性 与 可 靠 性 ; 

16) 普 适 计算 ; 





O 不同 学校 的 本 科 及 研究 生 课程 可 能 存在 差异 。 
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17) 嵌入 式 系 统 的 影响 。 
本 书 的 历史 


自 本 书 第 1 版 在 2003 年 发 行 之 后 ， 嵌 入 式 系统 的 快速 发 展 带 来 了 很 多 新 的 产 
物 。 同 时 ， 许 多 领域 的 重点 也 发 生 了 改变 。 我 们 就 需要 根据 这 些 变化 ， 来 重新 对 其 
些 课题 进行 讨论 。2007 年 本 书 的 德语 第 1 版 出 版 后 ， 我 们 开始 了 新 的 研究 。 至 此 ， 
发 行 基本 上 是 全 新 的 英语 版 本 变 得 很 有 必要 ， 也 即 当 前 的 第 2 版 。 

本 书 引用 中 未 能 提 及 版 权 或 商标 的 名 称 ， 它 们 同样 受 法 律 保护 。 

欢迎 您 阅读 本 书 ! 


Peter Marwedel 


多 特 蒙 德 (78H), 201048 A 
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Wiederkehr、Thorsten Wilmer 和 Henning Garus 参与 了 本 书 的 校对 工作 。 以 下 同事 及 
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第 1 章 E 介 . 


L1 ”应 用 领域 与 实例 


AKA cy-phy (信息 一 物理 ) 系统 存在 于 多 种 领域 ， 如 下 罗列 了 此 类 系统 
应 用 的 关键 领域 : 

1) 汽车 电子 : 在 科技 较为 发 达 的 国家 ， 消 费 者 都 要 求 高 级 汽车 具有 较 多 的 辅 
助 功能 ， 而 这 些 辅助 功能 都 是 基于 大 量 电子 元 器 件 实现 的 ， 如 安全 气囊 控制 系统 、 
发 动机 控制 系统 、 防 抱 死 制 动 系统 ( Anti- Braking System，ABS) 、 车 身 电子 稳定 系 
统 (Electronic Stability Programs, ESP) 和 其 他 一 些 安全 保护 功能 ， 以 及 车 载 空调 、 
GPS 〈 全 球 定位 系统 ) 、 防 盗 保 护 等 。 髋 入 式 系统 同样 可 以 减 小 汽车 对 环境 的 影响 。 

2) 航空 电子 : 飞机 的 重要 价值 依赖 于 其 包含 的 大 量 信息 处 理 设备 ， 如 飞行 控 
制 系统 、 防 碰撞 系统 、 导 航 信息 系统 等 。 帆 入 式 系 统 可 以 减少 飞机 排放 物 (如 二 
氧化 碳 ) 。 当 然 ， 对 于 飞机 ， 可 靠 性 是 最 为 重要 的 。 

3) 铁路 : 铁路 与 汽车 及 飞机 的 情况 相似 ， 也 需要 极 高 的 安全 性 与 可 靠 性 。 

4) 电信 : 移动 电话 是 近年 来 增长 最 快 的 市 场 之 一 。 它 的 射频 (Radio Frequen- 
cy, RF) 设计 、 数 字 信 号 处 理 及 低 功 耗 设计 都 是 其 很 关键 的 因素 。 当 然 ， 通信 中 
的 其 他 一 些 因素 也 很 重要 。 

5) 医疗 保健 : 尤其 是 在 一 些 老龄 化 的 国家 ， 医 疗 保健 产品 的 重要 性 日 益 明 
显 。 将 先进 的 信息 处 理 技术 应 用 到 医疗 设备 中 ， 这 会 是 一 个 潜在 的 巨大 市 场 。 事 实 
上 ， 有 多 种 技术 都 可 以 被 应 用 到 这 一 领域 。 

6) 安全 : 随 着 各 种 安全 设备 市 场 利 润 的 增长 ， 舱 人 式 系统 也 可 以 推动 这 一 领 
域 的 发 展 。 如 利用 指纹 识别 传感器 、 人 脸 识 别 这 类 手段 ， 来 对 访客 的 身份 进行 安全 
识别 /认证 。 l 

如 SMARTpen® (智能 笔 ) [IMEC，1997] ， 它 提供 了 一 种 支付 时 的 认证 方式 
( 见 图 1.1)。 








六 按钮 

£ _ m 

混合 信号 ASIC 电池 倾斜 传感器 ”压力 与 加 速度 指示 
+ 发 射 机 传感器 





图 1.1 智能 笔 〈 最 初 设计 ) 
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智能 笔 是 像 一 支 笔 一 样 的 检测 仪器 ， 它 可 以 分 析 用 户 在 签字 时 的 一 些 物理 特 
人 性。 如 倾斜 、 压 力 及 加 速度 。 这 些 数据 被 上 传 到 主机 PC， 与 主机 所 存储 的 用 户 相 
关 数 据 进 行 对 比 ， 从 而 判断 两 者 的 一 致 性 。 最 近 ， 使 用 智能 笔 来 记录 笔 体 这 -技术 
已 经 开始 商用 ， 当 然 它 不 仅仅 局 限于 认证 领域 。 

7) 消费 类 电子 产品 : 视频 与 音频 设备 是 电子 产品 中 的 重要 组 成 部 分 ， 集 成 到 
其 中 的 信息 处 理 单元 的 数量 近年 来 一 直 保持 增长 。 基 于 更 先进 的 信号 处 理 技术 ， 这 
一 领域 提供 了 更 多 的 新 功能 及 更 好 的 产品 质量 。 电 视 机 (尤其 是 高 清 电 视 机 ) 、 智 
能 手机 及 游戏 机 均 集成 了 更 高 性 能 的 处 理 器 及 更 大 的 内 存 ， 它 们 都 是 嵌入 式 系统 在 
当下 的 典型 产品 。 

8) MIRE: 加 工 设备 是 嵌入 式 /信息 一 物理 系统 应 用 的 传统 领域 ， 这 已 经 
有 长 达 几 十 年 的 历史 了 。 对 此 类 系统 ， 安 全 性 比 能 耗 更 重要 。 图 1.2 (来 自 Kopetz 
的 研究 【Kopetz，1997] ) 展示 了 一 个 带 排水 管道 的 容器 ， 管 道上 F 有 一 个 阀门 及 _- 
个 传感器 。 根 据 从 传感器 得 到 的 数据 ， 计 算 机 可 以 控制 流向 管道 的 液体 流量 。 





图 1.2 阀门 的 控制 


图 1.2 中 的 阀门 是 一 种 执行 机 构 (其 定义 在 后 面 会 给 出 )。 

9) 智能 楼 字 : 利用 先进 的 信息 处 理 技术 ， 可 以 改善 楼 宇 的 舒适 性 ， 减 少 建筑 
户 的 能 量 消耗 ， 增 强 楼 宇 的 安全 性 。 为 了 实现 这 一 目的 ， 楼 宇内 各 个 独立 的 传统 子 
系统 也 必须 互 连 。 这 意味 着 需要 将 空调 器 、 照 明 、 门 禁 、 人 群 聚集 及 分 散 的 信息 集 
中 到 单一 系统 中 。 对 于 大 厦 内 无 人 的 房间 ， 空 调 系统 就 可 以 减少 运行 时 间 与 降低 运 
行 强度 ， 其 运行 噪声 也 就 会 减 小 ， 灯 光 的 照明 强度 也 应 当 自 动 降低 。 智 能 的 百叶 窗 
系统 也 可 以 辅助 空调 与 照明 效果 。 建 筑 内 可 用 的 房间 会 有 相应 的 显示 ， 这 将 方便 办 
公 人 员 的 会 议 安排 及 房间 的 打扫 工作 。 在 紧急 情况 下 ， 仍 然 有 人 的 房间 可 被 显示 在 
大 厦 的 人 口 处 〈 在 大 厦 仍 然 有 电力 供应 的 情况 下 ) 。 这 样 ， 能 量 将 在 制冷 、 制 热 及 
照明 等 环节 中 被 节省 下 来 ， 同 时 ， 大 厦 的 安全 性 也 得 到 了 增强 。 这 样 的 建筑 最 初 也 
许 只 会 是 高 档 的 办 公 楼 ， 但 这 种 高 能 效 建筑 的 设计 趋势 同样 会 影响 到 私人 住宅 的 设 
计 。 其 目标 之 一 ， 就 是 设计 出 零 能 耗 的 建筑 〈 即 建筑 产生 的 能 耗 与 其 消耗 的 能 
相当 ) [Northeast Sustainable Energy Association ，2010] 。 这 样 的 设计 也 会 为 减少 全 
球 二 氧化 碳 的 排放 及 减 慢 气候 变 暖 效应 作出 贡献 。 

10) 物流 : 嵌入 式 / 信 息 一 物理 系统 可 以 以 多 种 方式 应 用 到 这 一 领域 。 基于 射 
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频 识 别 (Radio Frequency IDentification, RFID) 技 
术 ， 可 以 在 全 球 范 围 很 容易 地 识别 每 个 物体 ， 并 加 
以 区 分 。 当 前 的 移动 通信 向 人 们 提供 了 前 所 未 有 的 
接 和 人 可 能 性 。 对 物流 的 快速 性 、 可 追踪 性 的 要 求 ， 
使 伐 人 式 系统 与 物流 相 结合 。 事 实 上 ， 物 理 一 信息 
系统 也 为 减少 物流 运作 中 的 能 量 消耗 作出 了 贡献 。 

11) lat A: 机 器 人 也 是 能 和 人 式 /信息 一 物理 
系统 的 传统 应 用 领域 之 一 。 机 械 设计 对 机 器 人 非常 
重要 ， 前 面 所 描述 的 很 多 参数 也 将 被 应 用 于 机 器 人 
设计 。 最 近 ， 一 些 可 模仿 动物 与 人 类 行为 的 机 器 人 
已 经 被 设计 出 来 了 。 图 1.3 就 展示 了 这 样 一 个 机 
fir o 

12) 军事 应 用 : 信息 处 理 技术 应 用 在 军事 设备 
上 已 经 有 多 年 的 历史 了 。 事 实 上 ， 早 期 的 计算 机 就 
被 用 于 分 析 军 事 雷 达 信 号 。 图 1.3 机 器 人 “Johnnie”(H. 

以 上 这 些 都 展示 了 能 人 式 /信息 一 物理 系统 的 Ulbrich, F. Pfeiffer, Lehrstuhlfür 
多 种 应 用 实现 。 在 同一 本 书 中 讨论 这 些 般 入 式 系统 Angewandte Mechanik, 48/2 























的 意义 ， 在 于 它们 虽然 在 物理 构造 上 有 很 大 差异 ， 人 © ae 
但 它们 的 信息 处 理 有 很 多 相通 之 处 。 黑 工 业 大 学 ) 


1.2 共同 特征 


这 些 系统 的 共同 特征 如 下 : 

1) 信息 一 物理 系统 必须 是 可 靠 的 。 

很 多 信息 一 物理 系统 都 对 安全 性 有 较 高 的 要 求 ， 它 们 必须 具有 较 高 的 可 靠 性 。 
核电 站 就 是 对 安全 性 有 茄 刻 要 求 的 系统 之 一 ， 它 的 部 分 功能 也 是 由 软件 控制 的 。 当 
然 ， 可 靠 性 对 其 他 一 些 系统 也 至 关 重 要 ， 如 汽车 、 火 车 、 飞 机 等 。 它 们 之 所 以 是 安 
全 、 关 键 的 系统 ， 重 要 的 原因 在 于 它们 都 直接 与 物理 世界 联系 ， 并且 对 物理 环境 有 
直接 影响 。 

系统 的 可 靠 因 素 可 以 用 如 下 特性 进行 描述 : 

D 可 靠 性 : 系统 无 故障 地 完成 规定 功能 的 能 力 9 。 

© 可 维护 性 : 系统 故障 后 ， 在 规定 时 间 内 按 规定 方法 检修 ， 恢 复 到 规定 功能 
的 能 














O ”本 书 第 5 章 将 给 出 此 术语 的 正式 定义 。 
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© 可 使 用 性 : 系统 可 用 于 完成 规定 功能 的 程度 。 为 了 使 系统 具有 和 较 高 的 可 用 
性 ， 系 统 必须 具有 更 高 的 可 靠 性 与 可 维护 性 。 

@ 安全 性 : 系统 不 会 带 来 负面 伤害 或 损失 。 

O 保密 性 : 只 有 经 过 授权 与 认证 ， 才 能 访问 系统 中 的 加 密 数 据 。 

设计 初始 ， 工 程 师 一 般 都 将 注意 力 集中 在 系统 的 功能 上 ， 想 当然 地 认为 可 靠 性 
部 分 可 以 在 系统 工作 的 后 期 添加 。 事 实 上 ， 这 种 方式 根本 行 不 通 ， 因 为 当前 的 设计 
与 所 需 的 可 靠 性 是 矛盾 的 。 如 系统 的 最 初 架 构 就 不 合理 ， 则 宛 余 必 不 可 免 。 因 此 ， 
“考虑 系统 的 可 靠 性 ， 绝 不 能 做 事后 诸葛 ”， 必 须 在 最 初 设计 系统 时 就 考虑 到 [Ko- 
petz, 1997], 

即使 是 极其 谨慎 设计 的 系统 ， 如 果 假 定 的 负荷 或 者 是 可 能 的 故障 在 预期 之 外 ， 
系统 也 有 可 能 失效 [ Kopetz，1997 ] 。 举 例 来 说 ， 当 一 个 系统 在 它 最 初 假定 的 温度 
范围 之 外 工作 时 ， 它 就 有 可 能 失效 。 

2) 般 入 式 系统 必须 高 效率 。 可 以 从 如 下 方面 来 评估 一 个 藤 入 式 系统 的 效率 : 

D 功 耗 : 功 耗 是 评价 处 理 器 平台 的 重要 因素 。 由 图 1.4 (H H. De Man [ Man, 
2007] 提供 ， 并 基于 Philips 的 一 些 信息 ) 可 以 看 出 ， 这 方面 的 技术 一 直 在 与 时 俱 
进 〈 相 应 于 制造 工艺 ) 。 

1000 
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图 1.4 时 间 和 技术 带 来 的 能 效 改 变 (© Philips, Hugo de Man, 2007) 


很 显然 ， 随 着 科技 的 发 展 ， 集 成 电路 的 尺寸 在 变 小 ， 每 焦耳 能 量 所 能 完成 的 操 
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作 中 却 在 一 直 增 多 。 对 图 1. 4 中 的 处 理 吕 平台， 专用 集成 电路 (Application Specific 
Integrated Circuits, ASIC) 在 单位 能 量 中 所 能 完成 的 操作 最 多 ; 对 于 现场 可 编程 序 
门 阵列 (Field Programmable Gate Arays，FPCA， 参 见 3.3.4 节 )， 单 位 能 量 所 能 完 
成 的 操作 较 ASIC 要 低 约 一 个 数量 级 。 对 于 软件 编程 的 处 理 器 平台 ， 单 位 能 量 所 能 
完成 的 操作 还 要 少 一 些 ， 但 这 一 类 处 理 器 会 提供 较 大 的 软件 灵活 性 。 如 FPGA 一 类 
的 可 重 配器 件 也 有 一 定 的 灵活 性 ， 但 这 取决 于 有 多 少 功能 可 以 采用 这 种 灵活 的 设 
it; 对 ASIC 一 类 的 硬件 设计 来 讲 ， 则 没有 灵活 性 可 言 。 灵活 性 与 功 耗 的 权衡 对 软 
件 处 理 器 平台 同样 适用 : 某 些 处 理 器 如 果 针 对 特定 的 应 用 进行 优化 ， 如 对 数字 信和 号 
处 理 器 (DSP) 进行 特定 优化 ， 则 其 功 耗 可 能 也 可 以 达到 可 重 配器 件 的 等 级 。 对 于 
通用 的 标准 处 理 器 ， 在 图 1.4 中 ， 比 如 x86 一 类 的 处 理 器 ( 即 MPU), RISC 处 理 
at, KH IBM 和 Sony 公司 设计 的 Cell 处 理 器 ， 这 类 通用 处 理 器 单位 焦耳 所 能 完成 
的 操作 是 最 少 的 。 

根据 设计 经 验 ， 假 定 一 个 智能 手机 的 功 耗 被 限制 在 2W 以 内 ， 这 其 中 一 半 的 
功 耗 将 消耗 在 RF 传输 、 显 示 及 音频 放大 上 ， 剩 下 的 1W 将 用 于 计算 功能 。 对 其 进 
行 功 耗 限 制 的 原因 ， 一 方面 缘 于 电池 本 身 能 力 的 限制 ， 另 一 方面 则 是 需要 使 设备 保 
持 在 一 个 合理 的 工作 温度 范围 内 。 也 许 在 不 久 以 后 ， 通过 技术 的 改进 可 以 延长 电池 
的 工作 时 间 ， 但 对 热量 的 限制 仍 将 使 人 们 将 其 功 耗 限制 在 2W 以 内 。 当 然 ， 对 于 较 
大 的 设备 ， 应 当 允 许 其 消耗 更 多 的 能 量 。 但 是 出 于 环保 方面 的 考虑 ， 仍 需要 使 设备 
保持 低 功 耗 。 

尤其 是 在 多 媒体 应 用 领域 ,对 计算 量 的 需求 一 直 保持 着 高 速 增长 ，De Man 与 
Philips 估计 ， 对 于 高 端的 多 媒体 应 用 ， 每 秒 约 需要 100 亿 ~ 1000 亿 次 的 计算 。 图 
1.4 展示 的 是 先进 的 硬件 技术 可 以 在 每 焦耳 ( = Ws) 能 量 中 提供 的 操作 数 。 这 意 
味 着 即使 是 最 有 效 的 平台 硬件 ， 也 不 能 提供 我 们 所 需 的 效率 ， 这 也 意味 着 我 们 必须 
尽 全 力 去 提高 它们 的 能 效 。 通 用 处 理 器 (如 MPU 及 RISC) 基本 上 很 难 改变 其 低能 
效 的 特点 。 

这 种 情况 也 早已 被 预测 (如 根据 国际 半导体 技术 发 展 蓝 图 [ITRS, 2009] 的 
顶 测 ) ， 能 耗 将 是 新 的 移动 应 用 的 关键 限制 。 根 据 这 份 蓝图 , “… 这 种 趋势 意味 着 ， 
在 一 种 适当 的 度量 标准 下 ， 能 耗 的 性 能 到 2020 年 应 该 增长 1 ~ 2 个 数量 级 。 这 就 提 
出 了 如 何在 单位 焦耳 产生 最 大 性 能 的 问题 ， 同 时 这 也 需要 将 信息 理论 与 热力 学 结合 
起 来 思考 ”。 

D 运行 效率 : 柑 入 式 系统 必 须 尽 可 能 地 挖 据 可 用 的 硬件 能 力 。 对 于 特定 的 硬 
件 平 台 ， 应 该 尽量 作出 最 有 效 的 应 用 实现 。 举 例 来 说 ， 编 译 器 不 应 该 引入 元 余 的 运 








O 在 此 处 ， 操 作 指 32bit 的 加 法 。 
O 产 格 来 讲 ， 并 不 是 消耗 电力 或 与 其 相关 的 能 量 ， 使 用 电力 消耗 来 衡量 能 耗 的 时 代 正 在 消失 ， 更 多 地 
将 使 用 热量 来 衡量 系统 的 能 耗 。 





6 就 入 式 系统 设计 RAKE BB RRA ( 原 书 第 2 版 ) 





行 过程 ， 因 为 这 会 导致 额外 的 能 量 浪费 ， 同 时 意味 着 可 能 需要 使 用 更 快 的 时 钟 
频率 。 

OREERT: 对 于 骨 入 式 系统 ， 例 如 智能 手机 及 机 顶 盒 一 类 的 系统 ， 只 有 在 
少数 情况 下 才能 进行 动态 加 载 并 运行 代码 。 出 于 互 连 与 安全 性 的 考虑 ， 这 些 场景 在 
未 来 数 年 仍然 不 会 太 多。 嵌入 式 系统 的 代码 一 般 都 直接 存储 在 系统 中 。 赎 入 式 系统 
一 般 部 没有 硬盘 来 存储 程序 与 数据 ， 因 此 希望 代码 尺寸 尽 可 能 小 。 对 于 所 有 信息 处 
理 电路 都 集成 在 单 片 的 片上 系统 (System on a Chip，SoC)， 尤 为 如 此 。 如 果 可 存 
储 代码 的 内 存 被 集成 在 芯片 内 ， 则 它 需 要 被 加 以 高 效 利 用 。 不 过 ， 当 可 以 采用 高 密 
度 的 内 存 (使 用 每 卷 的 bit 数 来 衡量 ) 时 ， 这 一 设计 重点 也 许 会 发 生变 化 。 基 于 闪 
存 的 内 存 也 许 会 对 此 产生 较 大 的 影响 。 

质量 : 所 有 便携 式 系统 都 必须 是 轻 量 级 的 。 购 买 一 个 便携 式 系统 时 ， 其 质 
量 是 常常 被 重点 考虑 的 因素 。 

@ RA: 对 于 份额 巨大 的 大 众 市 场 ， 如 消费 类 电子 产品 ， 甚 市场 竞争 已 经 达 
到 白热化 的 状态 ， 这 就 要 求 需要 对 硬件 资源 进行 充分 、 高 效 的 利用 ， 同 时 也 要 控制 
软件 开发 的 成 本 。 对 于 确定 的 功能 ， 应 当 尽量 以 最 少 的 资源 来 实现 。 这 意味 着 也 要 
尽 可 能 减少 硬件 资源 与 能 耗 ， 降 低 时 钟 频率 与 供电 电压 ， 只 使 用 必 不 可 少 的 元 器 
件 。 如 果 不 能 改变 最 坏 的 运行 情况 ， 则 某 些 组 件 (如 过 多 的 缓存 或 内 存 管理 单元 ) 
通常 可 以 从 系统 设计 中 省 去 。 

3) 嵌入 式 系统 通常 是 与 真实 的 物理 环境 相连 接 的 ， 它 们 通过 传感器 (Sen- 
sors) 收集 环境 信息 ， 再 通过 执行 器 (Actuators) 去 控制 环境 。 
定义 : 执行 器 是 将 数字 量 转化 为 机 械 动 作 的 设备 。 

这 种 与 物理 环境 的 联系 也 与 “信息 一 物理 系统 ”相关 。 髋 入 式 系统 教育 一直 
关注 于 如 何 对 微 控制 器 编程 ， 而 往往 忽略 了 这 种 关联 。 在 这 方面 ， 信 息 一 物理 系统 
这 一 新 术语 ， 使 嵌 人 式 系统 设计 从 微 控制 器 编程 中 得 到 了 解放 。 

4) 很 多 信息 一 物理 系统 都 必须 满足 实时 性 的 约束 。 在 给 定时 间 内 ， 如 果 系 统 
的 计算 未 能 完成 ， 则 有 可 能 导致 系统 信息 丢失 (如 影响 到 音频 或 视频 的 质量 ) ， 其 
至 可 能 给 用 户 带 来 伤害 〈 如 汽车 、 火 车 或 飞机 未 能 完成 预定 的 操作 ) 。 一 些 实时 性 
的 约束 被 称 为 硬 约束 : 
定义 :“ 不 满足 时 间 限 制 则 将 导致 严重 后 果 的 约束 ， 称 为 硬 约束 ”[ Kopetz， 
1997] ， 所 有 的 其 他 时 间 约 束 都 被 称 为 软 约 束 。 

现在 ， 很 多 信息 处 理 系统 都 在 使 用 能 整体 提高 信息 处 理 速 度 的 各 种 技术 ， 如 使 
用 缓存 来 提高 系统 的 整体 性 能 。 在 某 些 场合 ， 使 用 重复 传输 某 些 信息 来 提高 通信 的 
可 靠 性 。 如 以 太 网 协议 : 它们 在 原 消息 丢失 后 ， 都 会 进行 重 发 。 一 般 来 说 ,这样 的 
重复 仅仅 会 (希望 仅 是 如 此 ) 导致 很 小 的 性 能 损失 ， 某 些 信息 也 将 产生 相对 于 正 
常情 况 多 个 数量 级 的 延 时 。 而 对 于 实时 系统 ， 这 种 性 能 上 的 折 中 或 是 延 时 将 是 不 可 
被 接受 的 。“ 一 个 确定 的 系统 响应 ， 绝 对 不 可 以 用 统计 学 来 解释 ”[ Kopetz，1997] 
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5) 典型 地 ， 上 艇 人 式 系统 都 是 激励 系统 ， 定 义 如 下 : 
定义 :“ 根 据 物理 环境 决定 的 节奏 ， 系 统 持续 地 与 物理 环境 交互 并 等 待 来 自 物理 环 
境 的 输入 并 进行 处 理 ， 这 便 是 一 个 激励 系统 ”[ Bergé et al. , 1995], 

激励 系统 可 以 视 作 一 直 处 在 某 一 状态 ， 等 待 着 输入 信和 号。 对 于 每 一 个 输入 ， 它 
们 完成 一 些 计算 并 产生 输出 及 新 的 状态 。 机 器 人 是 此 类 系统 的 典型 模型 。 但 是 ， 解 
决 问题 的 算法 的 描述 函数 ， 却 不 是 此 类 模型 。 

6) 大 部 分 做人 入 式 系统 都 是 同时 包含 数字 与 模拟 部 分 的 混合 系统 。 模 拟 部 分 在 
连续 时 间 上 使 用 连续 信号 ， 同 时 数字 部 分 在 离散 时 间 上 使 用 离散 信号。 

7) 大 部 分 戏 人 入 式 系统 并 不 使 用 键盘 、 鼠 标 及 大 型 的 显示 器 作为 其 人 机 接口 ， 
它们 一 般 使 用 特定 的 人 机 接口 ， 如 按键 ， 滑 轮 、 踏 板 等 。 因 此 ， 用 户 一 般 很 难 感觉 
到 信息 处 理 的 过 程 。 也 正 是 因为 如 此 ， 新 时 代 的 计算 形式 也 被 称 为 消失 的 计算 。 

8) 这 些 应 用 一 般 也 都 是 面向 特定 应 用 的 ， 如 用 于 控制 汽车 或 火车 的 处 理 器 ， 
肯定 不 会 去 运行 一 个 电脑 游戏 ， 或 者 去 绘制 表格 。 对 此 有 两 个 主要 原因 

中 运行 其 他 程序 将 降低 系统 的 可 靠 性 ; 

D 只 有 在 系统 有 闲置 资源 的 前 提 下 ， 才 可 能 运行 额外 的 程序 。 但 对 于 一 个 高 
效 的 系统 来 说 ， 是 不 会 有 这 样 的 闲置 资源 的 。 

然而 ， 在 诸如 智能 手机 一 类 的 设备 中 ， 这 种 情况 也 正 慢 慢 地 发 生 着 改变 。 智 能 
手机 正 演化 为 与 PC 类 似 的 系统 ， 它 已 经 很 难 再 被 称 为 信息 一 物理 系统 。 据 AUTO- 
SAR (汽车 开放 系统 架构 ) 的 介绍 [AUTOSAR，2010] ， 这 种 情况 也 正在 汽车 工业 
中 发 生 。 

9) 嵌入 式 系统 的 教育 成 熟 度 与 公众 参与 度 均 较 低 。 问 题 之 一 是 檬 人 式 系统 教 
学 需要 丰富 的 设备 ， 这 样 才能 激发 学 生 的 兴趣 并 参与 进去 。 其 次 ， 真 实 的 谍 人 式 系 
统 都 比较 复杂 ， 教 学 上 有 很 大 的 难度 。 

由 于 这 一 系列 的 原因 〈 最 后 一 个 除外 ) ， 寻 找 能 入 式 系统 设计 的 通用 方法 ， 与 
独立 分 析 各 个 不 同 的 应 用 领域 相 比 较 ， 有 着 更 实际 的 意义 。 

其 实 ， 并 不 是 每 一 个 嵌入 式 系统 都 完全 具有 以 上 特征 。 也 可 以 按 如 下 方式 来 
定义 “嵌入 式 系统 ": 满足 上 述 大 部 分 特征 的 信息 处 理 系 统 都 可 以 被 称 为 谨 信 式 
系统 。 这 个 定义 有 一 些 模糊 性 。 然 而 ， 似 乎 没有 必要 ， 也 无 法 去 消除 这 种 模 
糊 性 。 


1.3 RAD ABZ APR 


KARR RAE BABE Bit, MARRERO EER 
方面 的 工作 ， 在 软件 设计 的 同时 ， 还 要 兼顾 许多 其 他 的 设计 目标 ， 具 体 如 下 : 

1) 找 入 式 系统 需要 极 高 的 可 靠 性 ， 其 可 靠 性 等 级 要 远 高 于 传统 PC 系统 。 来 
看 一 些 因为 系统 可 靠 性 引发 事故 的 例子 ; 
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D 洛杉矶 机 场 的 音量 控制 系统 失控 达 3h [ Broesma，2004] 。 问 题 来 源 于 控制 系 
统 中 的 一 台 服 务 器 ， 每 次 重启 服务 器 后 ， 其 操作 系统 都 有 一 个 计数 器 来 记录 时 间 的 长 
度 ， 但 这 个 计数 器 在 大 约 48 天 之 后 就 会 溢出 。 因 此 ， 操 作 规范 要 求 运 维 人 员 在 每 个 
月 都 重新 启动 一 次 服务 器 。 但 在 出 问题 的 那 一 次 ， 运 维 人 员 刚 好 忘记 了 此 事 。 

D 很 多 计算 机 系统 故障 的 案例 都 被 上 报到 the risks digest, 它 是 一 个 面向 公众 
的 关于 计算 机 及 相关 系统 故障 讨论 的 论坛 (参见 [ Neumann, 2010]), 

2) 能 效 方面 的 考虑 ， 软 件 设计 不 能 脱离 硬件 进行 想当然 的 开发 ， 因 此 软件 与 
硬件 必须 在 设计 流程 中 综合 考虑 。 但 这 样 非常 困难 ， 因为 学 术 与 教育 机 构 一 般 都 不 
会 教育 学 生 如 何 进行 软 、 硬 件 结合 设计 。 而 且 电 子 工程 与 计算 机 科学 方面 的 结合 ， 
远 没 有 达到 我 们 期 望 的 标准 。 基 于 硬件 进行 合理 的 软件 应 用 实现 ， 才 会 使 系统 能 效 
最 高 。 然 而 ， 硬 件 设计 的 高 成 本 、 长 周期 ， 意味 着 不 能 对 其 设计 进行 灵活 变更 ， 所 
以 需要 在 效率 与 灵活 性 之 间 找 到 一 种 折 中 的 方案 。 

3) 嵌入 式 系统 还 必须 满足 许多 非 功 能 性 的 需要 ， 如 实时 约束 、 能 量 / 功 耗 以 
及 可 靠 性 等 。 当 然 ， 还 有 很 多 在 设计 中 需要 被 考虑 到 的 其 他 因素 ， 仅 仅 是 收集 这 些 
非 功能 性 的 需求 就 已 经 较为 困难 了 。 

4) 面向 物理 的 连接 有 了 更 多 含义 ， 如 必须 检查 系统 是 否 无 误 地 满足 了 实时 约 
束 。 对 时 间 的 管理 就 是 众多 挑战 之 一 【Lee，2006 1] 。 

5) 真实 的 系统 都 是 并 发 的 ， 管 理 并 发 性 是 嵌入 式 系统 中 的 另 一 个 主要 挑战 。 

6) 真实 的 嵌入 式 系统 都 是 复杂 的 。 骨 入 式 系统 包含 多 种 元 件 (Components ) , 
我 们 对 它们 的 组 合 设 计 (Compositional Design) 更 为 关注 。 这 也 意味 着 ， 我 们 需要 
了 解 元 件 组 合 带 来 的 影响 ， 如 我 们 想 知道 在 一 辆 车 上 加 装 GPS 后 ， 是 否 会 使 其 通 
信和 总 线 的 负荷 过 载 。 

7) 传统 的 顺序 编程 语言 并 不 是 描述 并 发 、 定 时 系统 的 最 佳 方式 。 

图 1.5 中 的 表格 强调 了 在 进行 应 用 实现 时 ， 对 于 基于 类 PC SHAR TR 
件 ， 在 设计 中 的 主要 差异 。 


















































[EAR 类 PC 
Ee 
架构 通常 是 紧凑 架构 通常 为 非 紧凑 架构 (x868) 
与 x86 兼 容 弱 相 关 强 相关 
| 固定 架构 ? 一 般 不 是 是 | 
计算 模型 (MoC) C+ 多 模型 (数据 流 、 离 散 事件 、…) | 大 部 分 为 汉 . 诺 依 曼 模型 
_| (C C++, Java) 
优化 目的 多 种 (BR. A) | 提升 平均 性 能 =a 
实时 性 联系 非常 紧密 ! 非 实时 
应 用 多 种 并 发 应 用 | 几乎 是 单个 应 用 
设计 时 的 已 知 应 用 | 几乎 没有 少数 (如 WORD) 














图 1.5 类 了 PC 硬件 以 及 戏 人 式 系统 硬件 的 应 用 范围 





1.4 设计 流程 


嵌入 式 系统 的 设计 是 一 项 相当 复杂 的 工作 ， 它 可 以 被 分 解 为 易于 管理 的 多 个 子 
任务 。 部 分 子 任务 必须 按 顺 序 进行 ， 部 分 子 任务 需要 多 次 迭代 。 

设计 方案 最 初 都 是 从 简单 的 想法 开始 ， 当 然 ， 这 些 想法 必须 是 与 实际 应 用 相 结 
合 的 。 而 后 ， 这 些 想法 成 为 设计 文档 。 在 设计 开始 之 前 ， 应 该 准备 好 标准 的 软件 模 
块 与 硬件 单元 ， 它 们 应 该 尽 可 能 被 加 以 重用 ( 见 图 1.6). 
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评估 与 验证 











图 1.6 简化 的 设计 流程 


在 图 1.6 中 〈 本 书 中 的 其 他 图 与 之 类 似 ) ， 圆 角 框 表示 数据 存储 ， 和 矩形 框 用 于 
表示 数据 加 工 。 典 型 地 ， 设计 信息 一 般 存 储 在 设计 仓库 ( Design Repository) 中 。 
设计 仓库 用 于 对 设计 模型 进行 管理 。 大 部 分 情况 下 ， 设 计 仓 库 需 要 提供 版 本 管理 或 
者 “修订 控制 "， 这 样 的 设计 仓库 如 CVS [ Cederqvist, 2006] 或 SVN [ Collins- 
Sussman et al. ，2008 ] 。 一 个 优秀 的 设计 仓库 管理 软件 需要 具备 设计 管理 的 接口 ， 
保持 其 对 开发 流程 与 工具 的 适应 ， 这 些 都 应 该 被 集成 到 一 个 友好 的 图 形 化 用 户 接口 
(Graphical User Interface, GUI) 中 。 设计 仓库 与 GUI 可 以 更 进一步 扩展 到 集成 开 
发 环境 (Integrated Development Environment, IDE) 中 ， 它 也 被 称 为 设计 框架 ( De- 
sign Framework) (如 [Liebisch and Jain, 1992]) 。 集成 开发 环境 记录 了 工具 与 设 
计 信 息 之 间 的 依赖 性 。 

基于 设计 仓库 ， 设 计 方 案 可 以 迭代 进行 。 在 每 一 个 设计 步骤， 设计 模型 都 可 以 
被 检索 到 ， 然 后 参与 决策 。 

在 开发 的 迭代 过 程 中 ， 应 用 被 实现 在 可 执行 的 平台 上 ， 同 时 产生 了 新 的 (或 
者 是 部 分 的 ) 设计 信息 。 这 种 产生 包含 了 将 应 用 实现 成 并 发 的 任务 ,将 其 功能 分 
解 到 具体 的 硬件 或 软件 的 实现 、 编 译 、 调 度 等 步 又。 

设计 需要 从 多 个 方面 进行 评估 ， 如 性 能 、 可 靠 性 、 能 耗 、 制 造 工艺 等 。 按 照 现 
有 的 工艺 ， 没 有 哪 一 个 设计 步骤 能 保证 绝对 正确 ， 因此 有 必要 对 设计 进行 验证 。 验 
证 包括 检查 中 间 及 最 终 的 设计 规范 ， 以 及 其 他 一 些 资料 。 每 一 个 新 的 设计 都 需要 被 
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提前 评估 与 验证 。 


源 于 效率 对 髋 入 式 系统 的 重要 性 ， 优 化 就 显得 非常 重要 。 有 多 种 可 能 的 优化 
方式 ， 如 较 高 层次 的 转化 方式 (如 使 用 高 级 循环 转化 )， 以 及 以 节能 为 目标 的 
优化 。 

设计 迭代 也 包含 用 例 准 备 及 对 可 测试 性 的 评估 。 如 果 在 设计 过 程 中 , 已 经 考虑 
到 了 可 测试 性 的 问题 ， 则 测试 也 应 该 同时 在 设计 中 进行 迭代 。 在 图 1.6 中 ,生成 用 
例 被 作为 了 设计 迭代 中 一 个 可 选 的 步骤 (参见 其 中 的 虚线 框 ) 。 如 果 生 成 用 例 不 在 
设计 迄 代 中 ， 则 它 必须 在 设计 完成 后 进行 。 

设计 仓库 应 该 在 每 一 个 步 又 完成 后 ， 进 行 相应 的 更 新 。 

设计 仓库 、 应 用 实现 、 评 估 、 验 证 、 优 化 、 可 测试 性 考虑 及 设计 信息 的 存储 ， 
其 具体 的 流程 可 能 是 变化 的 。 依 赖 于 使 用 的 设计 技术 ， 这 些 行为 可 能 会 以 多 种 形式 
交叉 进行 。 

本 书 站 在 较 高 的 层次 对 嵌入 式 系 统 设计 进行 了 阐述 ， 它 并 不 局 限于 对 某 种 特定 
的 设计 流程 或 工具 进行 讨论 。 因 此 ， 我 们 并 没有 给 出 一 个 详细 的 设计 步骤 。 对 于 一 
些 特定 的 设计 场景 ,我 们 可 以 “展开 ”图 1.6 中 的 循环 ， 并 且 将 其 与 具体 的 设计 
步 桑 关联。 例如， 图 1.7 展示 了 基于 SpecC [Gajski et al. ，2000] 的 一 个 设计 流程 
实例 。 
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图 1.7 基于 SpecC 的 设计 流程 实例 (简化) 


在 这 个 例子 中 ,列举 了 诸如 架构 研究 、 通 信 、 综 合 、 软 件 编译 与 硬件 集成 等 详 
细 步 又 。 关 于 这 些 术语 的 详细 定义 并 不 在 本 书 的 讨论 范围 。 在 图 1.7 中 ， 每 一 步 又 
都 明确 地 包含 着 验证 与 评估 ， 但 验证 与 评估 并 没有 作为 独立 步 又。 

图 1.8 是 对 图 1.6 展开 的 一 个 例子 ， 它 采用 的 是 V_model 的 流程 设计 方法 
[ V- Modell XT Authors, 2010], V-model 这 种 设计 流程 被 德国 很 多 IT 项 目 采纳 ， 
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尤其 是 与 政府 业务 相关 的 部 门 。 


需求 分 析 
系统 架构 
系统 设计 
软件 架构 
软件 设计 
单元 测试 
成 测 ; 
系统 集成 LA 
验收 与 使 用 


图 1.8 V-model 设计 流程 


































图 1. 8 清晰 地 展示 了 流程 中 的 每 一 步 需 要 完成 的 工作 。 这 些 步骤 与 软件 开发 流 
程 (其 精确 定义 也 不 在 本 书 的 讨论 范围 ) 中 的 确定 阶段 相对 应 。 请 注意 ， 设 计 决 
策 、 设 计 评估 与 设计 验证 都 在 图 1. 8 中 被 集中 到 一 个 方 框 内 。 应 用 知识 、 系 统 软件 
及 系统 硬件 并 没有 在 图 中 展开 。V- model 也 在 图 中 包含 了 集成 与 测试 阶段 (图 的 下 
奖 部 分 ) ， 它 与 图 1.6 中 的 测试 步骤 是 相对 应 的 。 图 1.8 采用 的 是 V_model 中 的 
“97” 版 绘制 的 。 最 新 的 V- model XT 版 本 允许 包含 更 多 的 设计 步骤 ， 这 种 更 新 与 
图 1. 6 中 对 设计 流程 的 解释 可 以 更 好 地 配合 。 还 有 其 他 一 些 迭 代 方法 ， 如 瀑布 模型 
(Waterfall Model) 、 螺 旋 模 型 (Spiral Model) ， 更 多 关于 幅 入 式 系统 软件 工程 的 资 
料 ， 可 以 参考 J. Cooling [ Cooling, 2003] 的 著作 。 

与 软件 设计 流程 的 模型 一 样 ， 硬 件 设计 y 
也 有 与 之 对 应 的 模型 。 如 Gajski 的 Y- Chart 








[ Gajski and Kuhn, 1983] ( 见 图 1.9) 就 是 ! - 设计 路 径 

一 种 非常 流行 的 设计 流程 模型 。 ae | it 
Gajski 从 三 个 维度 来 考虑 设计 信息 : 行 a O tees 

为 、 结 构 与 布局 。 第 一 维 仅 影响 行为 ， 高 层 ar oes 

模型 需要 描述 出 设计 的 整体 行为 ， 分 解 模型 ae 

则 描述 各 个 子 模块 的 行为 。 第 二 维 的 模型 包 物理 模型 

含 结构 信息 ， 如 硬件 模块 的 信息 ， 该 维度 的 图 1.9 Gajski 的 Y- Chart 与 设计 路 径 

高 层 模型 描述 相应 的 处 理 器 ， 低 层 则 描述 到 ( 粗 实 线 ) 


晶体 管 。 第 三 维 描述 了 芯片 的 物理 布局 。 设 

计 路 径 一 般 从 抽象 的 行为 描述 开始 ， 到 具体 的 几何 分 解 描述 结束 。 沿 着 这 样 的 路 
径 ， 设 计 流程 中 的 每 一 次 迁 代 都 有 步骤 与 之 对 应 。 图 1. 9 所 示 的 例子 ， 首 先 展示 的 
是 对 整体 的 实例 化 ;第 二 步 则 是 映射 这 些 行为 到 结构 化 的 组 件 ， 等 等 最终， 完成 
了 方案 实现 的 器 件 的 物理 布局 。 
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前 面 的 三 张 图 展示 了 大 量 的 设计 流程 ， 它 们 都 使 用 了 图 1.6 的 迭代 流程 。 
可 以 讨论 一 下 图 1.6 中 迭代 的 本 质 。 理 想 地 ， 可 以 描述 好 系统 的 属性 ， 然 后 让 
智能 工具 去 完成 测试 。 自 动 去 产生 设计 细节 的 这 一 行为 ， 这 称 之 为 综合 (Syn- 
thesis ) 。 
定义 : 综合 是 根据 对 期 望 行为 的 高 层 描 述 ， 使 用 与 之 相关 的 底层 组 件 来 完成 系统 描 
述 的 流程 [ Marwedel, 1990], 

成 功 的 综合 将 减少 很 多 人 工 完成 的 工作 。 在 设计 系统 中 使 用 综合 的 目的 ， 
Gajski [ Gajski et al. , 1994] 将 其 定义 为 “描述 一 综合 " ， 这 是 与 传统 的 “规范 一 
实验 一 改善 ” ， 即 与 “设计 一 仿真 ”流程 相对 而 言 的 。 传 统 概念 强调 了 人 工 设 计 与 
仿真 相 结合 这 样 的 事实 ， 如 怎样 去 发 现 设计 中 的 错误 。 在 传统 设计 步 双 中， 仿真 非 
常 重 要 。 


1.5 本 书 的 结构 


与 前 面 描述 的 设计 流程 相对 应 ， 本 书 的 结构 组 织 如 下 : 第 2 章 对 特定 的 方法 、 
语言 与 模型 进行 了 描述 ; 第 3 章 描 述 了 骨 入 式 系统 的 关键 硬件 组 件 ; 第 4 章 涉 及 系 
统 软件 组 件 ， 尤 其 是 蔡 入 式 操作 系统 ; 第 5 章 包含 嵌入 式 系统 的 设计 、 评 估 与 验 
证 。 将 设计 方案 在 操作 平台 进行 实现 ， 是 艇 人 式 系统 设计 流程 中 的 关键 步 又 之 一 。 
第 6 章 包 含 了 如 何 完成 设计 实现 的 一 些 标准 方法 ， 也 包含 了 标准 的 调试 技术 。 出 于 
对 低能 耗 设 计 的 需求 ， 这 就 需要 更 多 的 优化 技术 。 于 是 在 第 7 章 从 大 量 的 可 行 优化 
技术 中 选取 了 部 分 进行 前 述 。 第 8 章 简 要 介绍 了 硬 /软件 系统 集成 测试 。 附 录 包 含 
了 对 一 种 标准 优化 技术 的 描述 ， 以 及 有 助 于 更 好 地 理解 第 3 章 中 电路 图 的 预备 
知识 。 

对 于 给 定 的 应 用 ， 有 必要 去 设计 有 针对 性 的 硬件 ， 或 者 优化 处 理 器 的 架构 。 不 
过 ， 本 书 并 不 涵盖 硬件 设计 的 内 容 。Coussy 与 Morawiec [ Coussy and Morawiec, 
2008] 在 其 著作 中 提供 了 高 层 硬件 综合 技术 的 总 体 介绍 。 

大 部 分 传统 的 嵌入 式 系统 图 书 都 以 大 量 的 篇 幅 来 描述 如 何 使 用 微 控制 器 ， 如 处 
理 吕 的 内 存 、LO、 中 断 结构 。 有 很 多 这 样 的 书 ， 如 [Bal, 1996], [Heath, 2000], 
[ Ball, 1998], [ Barr, 1999], [Ganssle, 2000] [Barrett and Pack, 2005], [ Gan- 
ssle, 2008], [Ganssle et al. , 2008] 和 [ Labrosse, 2000], 

可 以 推断 ， 随 着 能 人 式 系统 复杂 度 的 增加 ， 将 来 这 类 书籍 的 内 容 范围 也 将 扩展 
到 包含 多 种 不 同 的 应 用 示例 、 创 建 硬件 模块 、 如 何 基于 操作 平台 进行 应 用 实现 ， 以 
及 评估 、 验 证 与 优化 技术 等 。 本 书 将 履 盖 所 有 这 些 方面 ， 其 目的 是 向 读者 引 介 嵌 人 
式 系统 ， 使 其 对 不 同 应 用 领域 都 有 一 定 了 解 。 

如 果 希 望 获 取 更 详实 的 信息 ， 这 里 还 推荐 了 一 些 资料 (在 本 书 的 准备 过 程 中 
已 经 用 到 了 部 分 资料 ) : 


x 
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1) 有 很 多 关于 特定 编程 语言 的 资料 ， 早 期 的 一 些 资料 有 Young [ Young, 
1982 | Burns 与 Wellings [ Burns and Wellings, 1990]. Bergé [Bergé et al. , 1995 ] 
与 De Micheli [ De Micheli et al. ，2002 ] 。 关 于 新 的 编程 语言 ， 如 SystemC [ Müller 
et al. , 2003], SpecC [Gajski et al. ， 2000] 与 Java [ Wellings, 2004] , [ Dibble, 
2008 ] [Bruno and Bollella, 2009]. [Java Community Process, 2002]. [ Anony- 
mous，2010b] ， 也 有 非常 丰富 的 相关 资料 。 

2) 在 Kopetz [Kopetz，1997] 的 著作 中 ， 讲述 了 如 何 设计 与 使 用 实时 操作 系 
统 (RTOS), 

3) 在 Buttazzo [ Buttazzo, 2002] 以 及 Krishna 与 Shin [ Krishna and Shin, 
1997] 的 著作 中 ， 较 完整 地 讲述 了 实时 调度 。 

4) 其 他 一 些 包含 艇 人 式 系统 的 著作 有 Laplante [ Laplante, 1997 | 、Vahid 
[ Vahid, 2002] the ARTIST road map [ Bouyssounouse and Sifakis, 2005], “Embed- 
ded Systems Handbook” [ Zurawski, 2006] 以 及 最 近 由 Gajski 等 人 [ Gajski et al. 
2009] 和 Popovici 等 人 [Popovici et al. , 2010] 编写 的 著作 。 

5) 在 舱 入 式 系统 教育 讲习 会 ( Workshops on Embedded Systems Education, 
WESE) 中 ， 涵盖 了 艇 人 式 系统 教育 方面 的 内 容 ， 参见 【Jackson et al. , 2009 | 。 

6) 欧洲 的 一 些 租 入 式 与 实时 系统 的 网 站 [Artist Consortium, 2010] 提供 了 大 
量 精彩 的 相关 内 容 。 

7) 来 自 于 一 个 名 为 ACM [ ACM SIGBED, 2010] 的 对 能 入 式 系 统 兴 
小 组 。 

8) 关于 能 人 式 信息 一 物理 系统 方面 的 研讨 会 文章 ， 可 以 在 嵌入 式 系统 周刊 
(访问 www. esweek. org) 及 信息 一 物理 系统 周刊 (访问 www. cpsweek. org) 上 查询 。 

9) 机 器 人 是 与 人 庶 入 式 信 息 一 物理 系统 紧密 相关 的 领域 ， 推 荐 Fu, Gonzalez 与 
Lee [Fu et al. ，1987] 关于 此 方面 的 著作 。 


1.6 思考 题 


. 请 列 出 “嵌入 式 系 统 ” 这 一 术语 的 恰当 定义 。 
. 怎样 定义 “信息 一 物理 系统 ”? 
. 以 一 些 身边 可 用 的 实例 来 解释 嵌入 式 系统 的 重要 性 。 
.比较 你 的 前 期 课程 与 本 章 描述 的 课程 ， 你 的 课程 中 缺少 了 哪些 预备 知识 ? 
现在 有 哪些 高 级 课程 ? 
5. 请 列举 出 嵌入 式 系统 的 应 用 领域 ,并且 至 少 列举 5 个 戏 入 式 系统 的 例子 。 
6. 请 列举 出 虑 人 式 系 统 的 至 少 6 个 特征 。 
7. 从 能 耗 方面 考虑 ， 怎 样 区 别 硬件 技术 上 的 差异 ? 
8. 假定 你 的 手机 使 用 720mAh 的 锂电 池 ， 其 额定 工作 电压 是 3.7V。 按 恒定 
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1W 的 功率 估算 ， 不 考虑 诸如 电压 降 之 类 的 次 要 因素 ， 多 长 时 间 电 池 电 量 会 消 
耗 完 ? 

9. 计算 效率 常用 每 瓦 功率 每 秒 所 能 完成 的 百 亿 次 运算 量 有 关 ， 这 与 图 1.4 中 
描述 的 因素 有 什么 区 别 ? 

10. 哪 一 类 的 实时 限制 被 称 为 “ 硬 约 束 ”? 

11. 如 何 定 义 术 语 “ 激 励 系 统 ”? 


第 2 音 规范 与 建 模 


21 需求 
现在 ， 将 根据 简化 的 设计 流程 ( 见 图 1.6)， 对 嵌入 式 系统 规范 与 建 模 的 需求 
和 实现 进行 描述 。 


嵌入 式 系统 规范 提供 了 设计 中 的 系统 模型 (System Under Design，SUD)。 横 型 
可 以 被 定义 如 下 [ Jantsch, 2004 ] : 
定义 :“ 模 型 是 实例 的 另 一 种 简化 ， 它 可 以 是 物理 实体 或 其 他 形式 。 对 于 给 定 任 
务 ， 其 模型 应 当 精确 包含 任务 本 身 的 特征 与 属性 。 如 果 它 不 包含 除 与 任务 相关 特征 
以 外 的 其 他 信息 ， 则 其 就 是 关于 任务 的 最 小 化 模型 。 

模型 都 使 用 某 些 语言 来 进行 描述 ， 这 些 语言 都 必须 能 描述 以 下 特性 9 : 

1) 层次 化 ( Hierarchy) : 一 般 而 言 ， 人 们 都 不 太 容 易 理 解 包 含 复杂 联系 的 多 
模块 (状态 机 、 组 件 ) 系统 。 而 描述 现实 中 的 系统 ， 就 需要 很 多 不 同 的 模块 ， 这 
会 使 人 们 更 难以 理解 。 层 次 化 〈 与 抽象 相 结合 ) 是 解决 这 种 困境 的 关键 机 制 。 层 
次 化 使 人 们 在 很 多 时 候 都 只 需要 处 理 很 少量 的 系统 模块 。 

有 两 种 层次 化 的 方法 : 

D 行为 级 (Behavioral Hierarchies) ; 它 的 各 层 模 块 包含 了 描述 系统 行为 的 必要 
信息 ， 这 类 模块 如 状态 、 事 件 以 及 输出 信息 。 

© 结构 级 (Structural Hierarchies); 它 描述 物理 组 件 如 何 组 成 了 整个 系统 。 

举例 如 ， 艇 人 式 系统 由 处 理 器 、 内 存 、 执 行 器 、 传 感 器 等 器 件 组 成 。 处 理 器 又 
包含 着 寄存 器 、 多 路 复 用 器 以 及 加 法 器 ， 多 路 复 用 器 又 是 由 多 个 门 单元 组 成 的 。 

2) 基于 模块 化 的 设计 ( Component- based Design) [ Sifakis, 2008]: 从 一 个 系 
统 所 含 的 各 个 模块 的 功能 ， 可 以 “容易 地 ”推断 出 整个 系统 的 功能 。 如 果 将 两 个 
模块 连接 在 一 起 ， 则 新 的 功能 一 般 也 是 可 以 猜测 的 。 

举例 如 ， 假 定 在 一 辆 汽车 上 新 增 了 模块 (如 GPS 单元 ) ， 则 其 产生 的 额外 功能 
(如 线路 等 ) 应 当 是 可 以 被 预测 的 。 

3) 并 发 性 (Concurrency) : 实际 系统 都 是 分 布 式 、 由 多 个 模块 组 成 的 并 发 系 














”此 处 参考 了 Burns A [Burns and Wellings, 1990], Bergé 等 人 [Bergé et al. , 1995] 与 Gajski 等 人 
[ Gajski et al. , 1994] 的 相关 资料 。 
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统 。 因 此 ， 也 很 有 必要 规范 系统 的 并 发 机 制 。 不 幸 的 是 ， 由 于 对 并 发 系统 的 可 能 行 
为 缺乏 认识 ， 人 们 并 不 擅长 理解 并 发 系统 以 及 实际 系统 中 的 相关 问题 。 

4) 同步 与 通信 (Synchronization and Communication ) : 各 个 模块 都 应 该 可 以 进 
行 通信 与 同步 。 如 果 没 有 通信 ， 组 件 之 间 就 不 能 协同 工作 ， 也 就 只 能 独立 地 使 用 单 
个 组 件 。 组 件 也 需要 协商 如 何 对 共有 资源 进行 使 用 ， 如 协商 如 何 进行 必要 的 互 斥 
操作 。 

5) 时 序 行为 《Timing- behavior) : 很 多 嵌入 式 系统 都 是 实时 系统 。 清 晰 的 时 序 
是 嵌入 式 系 统 的 特征 之 一 。 事 实 上 ， 对 于 “信息 一 物理 系统 ”， 时 序 模型 更 重要 ，。 
时 序 是 实际 系统 的 一 个 重要 组 成 要 素 ， 因 此 必须 根据 特定 的 能 入 式 /信息 一 物理 系 
统 ， 去 挖掘 其 相应 的 时 序 需求 。 

然而 ， 计 算 机 科学 方面 的 标准 理论 只 能 以 非常 抽象 的 形式 对 时 序 进行 建 模 。 
O- notation 就 是 这 方面 的 例子 。 标 记 仅 仅 反映 了 功能 的 增长 速率 。 它 常用 于 对 算法 
的 运行 时 间 进 行 建 模 ， 但 并 不 擅长 描述 系统 的 真实 执行 时 间 。 对 于 确实 的 物理 量 ， 
部 有 计量 单位 对 其 进行 描述 ， 但 0- notation 没有 ， 因 此 ， 它 并 不 能 区 分 一 个 世纪 与 
1s。 关 于 算法 的 终止 行为 ， 也 有 一 些 差异 : 标准 理论 要 求 算法 能 最 终结 束 ， 但 对 实 
时 系统 ， 需 要 在 给 定时 间 结 束 算法 。 

E. Lee 对 此 种 情况 导致 的 问题 作 了 一 个 清晰 的 总 结 : “从 般 入 式 软 件 的 观点 出 
发 ， 核心 抽象 (在 计算 机 科学 上 ) 缺乏 对 时 序 的 支持 ， 这 是 一 个 缺陷 ” [ Lee, 
2005 | 5 

根据 Burns 与 Wellings [ Burns and Wellings, 1990] 的 理论 ， 时 序 建 模 需 要 从 
以 下 4 个 方面 进行 考虑 : 

D 测量 消耗 的 时 间 : 对 于 很 多 应 用 ， 有 必要 去 统计 从 计算 开始 到 当前 , 已 经 
消耗 了 多 少时 间 。 通 过 读 取 一 个 计时 器 ， 可 以 做 到 这 一 点 。 

D 处 理 器 延 时 特定 时 间 的 意义 : 实时 编程 语言 一 般 都 有 产生 延 时 操作 指令 。 但 
不 幸 的 是 ， 这 类 操作 指令 应 用 在 嵌入 式 系统 软件 中 ， 并 不 能 产生 精确 的 延 时 。 假 定 了 
任务 需要 被 延 时 58” ， 这 时 ， 操 作 系统 一 般 会 将 了 任务 的 状态 从 “就 绪 (Ready)” 或 
“运行 (Run)”， 转 为 “ 挂 起 (Suspended)”。 在 经 历 8 的 延 时 后 ,7 的 状态 再 从 
“ 挂 起 ” 变 为 “就 绪 " 。 这 并 不 意味 着 任务 此 时 就 真正 开始 执行 。 如 果 一 些 高 优先 
级 的 任务 正在 运行 ， 或 者 操作 系统 是 非 抢 占 式 的 ， 则 了 任务 的 延 时 将 大 于 5。 

@ 可 以 指定 超时 : 很 多 情况 下 ， 需 要 去 等 待 一 系列 事件 的 发 生 。 然而 ， 这 个 
事件 可 能 并 不 能 在 给 定 的 时 间 间 隔 中 发 生 ， 人 们 也 希望 及 时 知道 这 一 点 。 如 可 能 
在 等 待 来 自 网 络 连接 的 响应 ， 如 果 在 时 间 6 内 仍然 没有 收 到 响应 ， 也 希望 得 到 通 
知 ， 这 就 是 超时 (Timeouts) 的 目的 。 实 时 编程 语言 般 都 会 提供 产生 超时 的 方 




















名 ”在 本 书 中 ， 不 区 分 进程 、 线 程 与 任务 。 
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法 ， 但 使 用 超时 机 制 常常 也 会 遇 到 跟 处 理 器 延 时 一 样 的 问题 。 

@ 指定 死 限 与 调度 的 方法 : 某 些 应 用 场景 要 求 计 算 与 处 理 都 必须 在 限定 的 时 
间 内 完成 。 如 如 果 汽 车 上 的 传感器 检测 到 事故 发 生 ， 则 需要 在 10ms 内 弹出 安全 气 
赛 。 在 此 背景 下 ， 必 须 保证 软件 能 在 10ms 内 作出 是 否 弹 出 安全 气 吉 决定 。 如 果 气 
赛 弹 出 过 晚 ， 很 可 能 会 危及 到 乘客 安全 。 大 部 分 的 编程 语言 并 不 支持 时 序 约束 ， 如 
果 在 以 后 这 种 情况 有 所 改变 ， 则 可 以 通过 单独 控制 文件 、 弹 出 菜单 等 来 指定 时 序 。 
即使 是 这 样 ， 情 况 仍然 不 容 乐 观 : 很 多 流行 的 硬件 平台 ， 它 们 的 时 序 受 多 种 因素 影 
响 ， 即 缓存 、 流 水 线 暂停 、 投 机 执行 、 任 务 抢 占 、 中 断 等 ， 它 们 都 使 硬件 的 执行 时 
间 难 以 预测 。 同 样 地 ， 时 序 分 析 (Timing Analysis) (对 时 序 约束 的 验证 ) 也 是 一 
个 非常 困难 的 任务 。 

6) 状态 机 行为 (State- oriented Behavior); 在 第 1 章 已 经 提 及 ， 机 器 人 在 激励 
系统 建 模 时 提供 了 很 好 的 机 制 。 因 此 ， 使 用 机 器 人 系统 可 以 比较 容易 地 描述 基于 状 
态 机 的 行为 。 但 是 ， 传 统 的 机 器 人 模型 有 很 多 不 足 ， 因 此 它们 不 能 进行 时 序 建 模 ， 
并 且 也 不 支持 层次 化 的 抽象 。 

7) 事件 处 理 ( Event- handling) : h FRARARA BONAR, BEA 
可 以 对 事件 进行 描述 的 机 制 。 这 些 事件 可 以 来 自 系 统 外 部 〈 由 环境 触发 ) ， 也 可 以 
来 自 系统 内 部 (来 自 SUD 的 模块 ) 。 

8) 异常 行为 (Exception- oriented be- 
havior): 在 很 多 实际 系统 中 ， 均 可 能 会 发 生 
异常 。 为 了 设计 一 个 可 靠 的 系统 ， 就 必须 较 
容易 地 描述 异常 行为 的 处 理 。 在 系统 的 每 个 
状态 〈 如 在 传统 的 状态 图 中 ) 都 设计 异常 处 
理 机 制 ， 这 显示 是 不 可 行 的 。 如 在 图 2.1 图 2.1 包含 异常 大 的 状态 图 
中 ， 输 入 上 有 可 能 会 导致 系统 异常 。 

在 每 个 状态 都 指出 此 异常 ， 将 会 使 图 2. 1 变 得 非常 复杂 。 对 于 一 些 有 多 种 转换 
的 大 型 状态 图 ， 这 种 情况 会 更 糟糕 。 下 面 将 描述 如 何 将 所 有 转换 集中 到 一 起 。 

9) 编程 元 素 (Presence of Programming Elements); 对 于 表达 指定 的 计算 ， 流 
行 的 编程 语言 已 经 被 证 明 是 很 方便 的 方式 。 因 此 ， 编 程 语 言 的 元 素 都 可 以 在 使 用 的 
技术 文档 规范 中 查找 到 ， 传 统 的 状态 图 并 不 能 满足 这 一 需求 。 

10) 可 执行 性 (Executability) : 规范 并 不 能 自动 与 人 们 头脑 中 的 想法 同步 。 执 行 ， 
则 是 对 这 些 想法 可 行 性 的 检查 。 此 时 ， 使 用 编程 语言 的 规范 就 有 很 显著 的 优势 。 

11) 可 支持 大 型 系统 设计 : 相信 式 软 件 项 目 正 向 着 大 型 化 、 复 杂 化 的 方向 发 
展 。 软 件 技术 中 已 经 有 设计 一 些 大 型 系统 的 机 制 ， 如 单元 化 就 是 其 中 之 一 ， 这 在 规 
范 方 法 学 中 可 以 学 习 到 。 

12) 支持 特定 领域 (Domain- specific Support): 如 果 同 样 的 规范 技术 可 以 被 应 
用 到 所 有 不 同类 型 的 嵌入 式 系统 上 ， 那 将 是 非常 美好 的 事情 。 因 为 这 可 以 减少 开发 
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规范 技术 的 工作 量 ， 也 减少 了 很 多 支持 工具 。 但 由 于 应 用 领域 的 多 样 化 ， 不 太 可 能 
做 到 某 一 种 语言 可 以 被 高 效 地 应 用 到 所 有 领域 。 如 控制 领域 、 数 据 领域 、 集 中 式 或 
分 布 式 应 用 领域 ， 它 们 都 可 以 从 针对 该 领域 的 编程 语言 中 相应 受益 。 

13) 可 读 性 〈Readability) : 人 们 必须 要 能 阅读 规范 ， 和 否则 也 就 无 法 验证 它 是 
MWET SUD 中 指明 的 目标 。 所 有 的 文档 也 应 该 可 以 被 计算 机 识别 。 因 此 ， 人 与 
计算 机 都 需要 能 识别 以 某 种 语言 描述 的 规范 。 

初始 阶段 ， 这 些 规范 可 以 采用 英语 或 日 语 等 自然 语言 进行 描述 ， 然 后 形成 设计 
文档 ， 最 终 的 实现 也 可 以 与 这 些 原始 文档 进行 对 比 。 但 在 后 续 的 设计 阶段 ， 自 然 语 
言 就 不 再 适用 ， 因 为 它 缺 乏 规 范 技术 的 一 些 关 键 因素 : 它 需 要 能 够 去 检查 规范 的 完 
整 性 与 缺失 ， 同 时 也 能 够 系统 地 从 规范 中 得 到 实现 方法 。 可 见 ， 自 然 语言 并 不 满足 

14) 便携 性 与 灵活 性 ( Portability and Flexibility) :规范 最 好 是 独立 于 特定 的 硬 
件 平台 ， 这 样 它们 才能 较 容易 地 在 多 个 目标 平台 上 使 用 。 理 想 的 情况 是 ， 硬 件 平台 
的 改变 对 规范 没有 影响 。 在 实际 中 ， 一 些小 的 变更 应 该 是 可 以 被 接受 的 。 

15) IE (Termination); 应 当 允 许 从 规范 中 结束 一 个 进程 。 这 意味 着 在 我 们 
使 用 的 规范 中 ， 挂 起 故障 任务 (断定 一 个 算法 是 否 应 该 终止 ， 参见 [ Sipser, 
2006]) 是 完全 可 行 的 。 

16) 支持 非 标准 的 VO RE: 许多 嵌入 式 系统 使 用 的 /0 设备 ， 都 与 PC 上 的 
典型 设备 不 一 样 ， 应 当 可 以 较为 方便 地 描述 这 些 系统 的 输入 与 输入 。 

17) 附加 属性 : 真实 的 SUD 同时 需要 有 许多 非 功能 性 的 特征 ， 如 容错 、 尺 寸 、 
扩展 性 、 预 期 寿命 、 能 耗 、 质 量 、 可 回收 性 、 用 户 友好 性 、 电 磁 兼 容 (EMC) 性 
等 。 在 一 个 正常 设计 的 系统 中 ， 全 部 考虑 到 这 些 特征 是 非常 困难 的 。 

18) 对 设计 可 靠 系统 的 支持 : 规范 技术 应 该 提供 对 设计 可 靠 系统 的 支持 。 如 
规范 语言 应 该 语义 清晰 ， 促 进 正式 的 验证 ， 有 能 力 去 描述 安全 性 及 安全 需求 。 

19) 便捷 地 生成 高 效应 用 : 出 于 对 嵌入 式 系统 高 效 性 的 要 求 ， 规 范 也 应 该 能 
帮助 系统 生成 高 效 的 实现 。 

20) 适当 的 计算 模型 (Model of Computation, MoC); 与 通信 技术 相 结合 的 顺 
序 执行 的 冯 “ 诺 依 曼 模型 是 一 种 常用 的 MoC。 但 是 ， 这 样 的 模型 有 一 系列 的 问题 ， 
尤其 是 在 嵌入 式 系统 应 用 中 ， 具 体 如 下 : 

D 缺乏 时 序 描述 能 力 。 

Q 15 + 诺 依 曼 模型 一 般 基于 全 局 共享 内 存 (如 在 Java 中 ) 进行 访问 。 它 必须 
保证 对 共享 资源 的 互 斥 操作 ， 否 则 在 允许 任务 抢占 的 多 线程 系统 中 ， 将 可 能 引发 
些 不 可 预见 的 问题 ” 。 使 用 原子 操作 是 进行 资源 互 斥 的 常见 方式 ， 但 它 可 能 会 引起 





O ”在 操作 系统 的 课程 中 一 般 会 有 这 样 的 例子 。 
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死 锁 。 在 系统 中 ， 死 锁 非常 难以 检测 ， 可 能 会 存在 数 年 之 久 。 
Lee [Lee，2006] 在 此 方面 提供 了 一 个 很 有 提示 意义 的 案例 ， 他 研究 了 Java 

中 简单 的 观察 者 模式 的 应 用 。 在 这 个 模式 中 ， 消 息 源 必 须 将 数值 的 改变 通知 给 所 有 
登记 过 的 观察 者 。 在 上 府 和 人 式 系统 中 ， 这 是 一 种 非常 常见 的 模式 ， 但 在 一 个 有 抢占 的 
冯 : 诺 依 曼 环境 中 ， 这 种 模式 却 很 难 实现 。Lee 给 出 了 基于 多 线程 的 Java 运行 环境 
的 可 能 实现 代码 : 

public synchronized void addListener(listener) {...} 

public synchronized void setValue(newvalue) { 





myvalue=newvalue; 

for (int i=0; i<mylisteners.length; i++) { 
myListeners[i].valueChanged(newvalue) 

} 

addListener 方法 用 于 新 的 观察 者 登记 ，setValue 方法 用 于 将 新 数值 通知 给 已 经 
登记 过 的 观察 者 。 简 言 之 ， 在 一 个 多 线程 环境 中 ， 线 程 是 可 以 被 随时 抢占 的 ， 这 将 
导致 当前 线程 的 执行 被 强制 打 断 。 当 setValue 正在 执行 时 ， 如 果 此 时 登记 新 的 观察 
者 ， 则 可 能 因 程序 的 并 发 性 出 现 问题 。 如 无 法 知道 新 的 数值 是 否 也 能 被 新 登记 的 观 
察 者 接收 到 。 另 外 ， 所 有 的 观察 者 组 成 了 此 类 的 一 个 全 局 数据 结构 。 因 此 ， 为 了 避 
免 部 分 数据 已 经 发 送 变 更 通知 ， 同 时 观察 者 集合 又 有 变化 的 情况 ， 这 些 方法 必须 进 
行 同步 。 这 样 的 话 ， 在 某 个 给 定 的 时 间 内 ， 只 能 是 两 种 方法 之 一 处 于 运行 状态 。 在 
多 线程 环境 中 ， 为 了 阻止 对 当前 执行 方法 的 非 期 望 打 断 ， 互 斥 操 作 是 很 有 必要 的 。 
为 什么 上 述 代 码 可 能 会 有 问题 呢 ? 因为 valueChanged 方法 可 以 对 某 些 资源 (如 R) 
进行 独占 式 的 访问 ， 如 果 资 源 是 为 某 些 其 他 方法 而 分 配 的 (如 A)， 那 么 只 有 在 A 
释放 了 资源 R 后 ，valueChanged 才能 访问 R。 如 果 A 在 释放 资源 R 之 前 ， 还 调用 了 
(可 能 是 间接 的 ) addListener 或 setValue， 那 么 将 产生 死 锁 :; setValue AHR, m 
R 需要 A 去 释放 ,但 A 又 只 能 在 addListener 或 setValue 返回 之 后 才能 释放 R， 这 样 
就 产生 了 死 锁 。 

这 个 例子 展示 了 在 被 抢占 的 多 线程 条 件 下 产生 了 死 锁 ， 因 此 多 线程 需要 对 关键 
资源 进行 互 斥 访问 。Lee [Lee, 2006] 认为 ， 给 此 类 问题 的 诸多 建议 “解决 ” 方 
案 ， 它 们 本 身 就 是 存在 问题 的 。 所 以 ， 在 多 线程 的 汉 : 诺 依 曼 环 境 中 ， 如 此 简单 的 
模式 也 非常 难以 正确 实现 。 这 个 例子 也 展示 了 人 们 很 难 理解 并 发 性 ， 即 使 是 经 过 严 
格 的 代码 检查 ， 它 们 仍然 是 较 大 的 潜在 风险 。 

Lee 总 结 认 为 “使 用 线程 、 信 和 号 量 与 互 斥 锁 编 写 的 非常 规 软件 ， 使 人 非常 费 
解 ”， 以 及 “ 虑 人 式 系 统 与 并 发 模式 并 不 兼容 。… 骨 入 式 系统 正常 工作 … 仅 需要 高 
效 的 调度 策略 就 足够 了 ”[Lee，2005] 。 

关于 死 锁 产生 的 根本 原因 ， 在 关于 操作 系统 的 书 中 有 详细 研究 (参见 [Stall- 
ings，2009 ] ) 。 从 这 些 书 中 可 以 总 结 出 4 个 常见 的 可 能 死 锁 的 场景 : 互 斥 操作 、 对 
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资源 没有 抢占 、 在 拥有 资源 的 同时 又 等 待 资源 、 线 程 之 间 的 循环 依赖 。 很 显然 ， 这 
4 个 场景 都 出 现在 了 上 面 的 例子 中 。 操 作 系 统 理论 并 不 会 提供 解决 此 类 问题 的 通用 
方法 。PC 系统 有 时 可 以 接受 一 些 概率 极 低 的 死 锁 ， 但 安全 设备 绝 不 能 接受 任何 
死 锁 。 

我 们 希望 通过 指定 SUD 从 而 不 再 过 多 地 去 关心 死 锁 问 题 。 因 此 ， 有 必要 研究 
非 汉 ' 诺 依 曼 的 MoC ， 从 而 避免 这 一 问题 。 从 2. 2 节 起 ， 将 研究 这 样 的 MoC。 读 者 
可 以 看 到 ， 在 这 样 的 MoC 中 ， 可 以 很 容易 地 实现 观察 者 模式 。 

从 上 述 列 举 的 诸多 需求 可 知 ， 已 经 很 难 有 一 种 单一 的 常规 语言 能 力 完全 满足 
这 些 需 求 。 因 此 在 实践 中 ， 必 须 去 采取 一 些 折 中 的 方案 ， 同 时 可 能 需要 使 用 多 种 语 
言 ( 每 一 种 语言 应 该 适合 描述 某 一 类 问题 )。 对 于 一 个 实际 的 设计 问题 ， 如 何 选择 
语言 ， 应 该 根据 应 用 的 领域 ， 以 及 产品 工作 的 环境 来 决定 。 接 下 来 ， 将 对 可 应 用 于 
实际 设计 的 多 种 语言 进行 总 体 介绍 ， 这 些 语言 将 展示 相应 计算 模型 的 本 质 特性 。 


2.2 计算 模型 


计算 模型 (MoC) 描述 了 对 于 计算 的 一 种 设想 机 制 。 在 常见 的 案例 中 ， 系 统 都 
包含 了 诸多 模块 。 在 实践 中 ,一 般 严 格 区 分 模块 中 的 计算 与 通信 中 的 计算 。 于 是 ， 
MoC 可 以 定义 (参见 [ Lee, 1999], [Janka, 2002], [ Jantsch, 2004 ] , [ Jantsch , 
2006]) 如 下 : 

1) BK (Components) 与 其 中 的 计算 分 布 : 程序 、 进 程 、 函 数 、 有 限 状 态 机 
都 是 可 能 的 模块 。 | 

2) 通信 协议 : 通信 协议 描述 了 模块 之 间 通 信 的 方式 。 基 于 异步 的 消息 传输 与 
重组 的 通信 和 是 通信 协议 中 的 典型 例子 。 

可 以 以 一 个 简 图 来 描述 模块 之 间 的 关系 。 简 图 中 提 及 的 计算 也 可 理解 为 进程 或 
任务 ， 相 应 地 ， 简 图 中 的 关系 也 可 以 理解 为 任务 图 或 进程 网 络 。 简 图 中 的 节点 代表 
本 执行 计算 的 模块 。 输 入 数据 流 经 过 计算 后 成 为 输出 数据 流 。 通 常 ， 计 算 都 是 使 用 
一 些 较 高 层 的 编程 语言 实现 的 。 迁 代 就 是 一 种 典型 的 计算 (有 可 能 是 非 终止 的 渤 
代 ) 。 在 每 一 个 送 代 的 周期 中 ,输入 数据 被 处 理 并 加 工 ， 然 后 产生 相应 的 输出 数据 
流 。 连 线 表示 了 模块 之 间 的 关系 。 现 在 将 要 详细 Ol 

© 


对 简 图 进行 介绍 。 
计算 模块 之 间 最 明显 的 关系 即 它 们 的 顺序 依 Or 


M: 只 有 在 某 些 计算 完成 后 ， 另 一些 计算 才能 开 Me) 
始 执行 ， 这 种 依赖 一 般 以 依赖 图 ( Dependence 
Ajn oh Ei ‘ ; 图 2.2 依赖 图 
Graph) 进行 描述 。 图 2. 2 就 展示 了 一 组 计算 之 间 
的 依赖 图 。 
定义 : 依赖 图 是 一 个 有 向 图 C = (V，E)， 其 路 是 节点 的 集合 ,EE 是 边 的 集合 。 
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边 五 SFxFT 决 定 了 节点 了 之 间 的 关系 。 如 果 (v, 4) EE, Wo, 称 为 w 的 直接 前 
4X (Immediate Predecessor), v, 称 为 v 的 直接 后 继 (Immediate Successor) 。 假 定 
EE“ 是 的 传递 闭 包 (Transitive Closure)。 如 果 (v, vn) eB*， 则 v Æ v, 的 前 驱 
(Predecessor) , v, 是 的 后 继 (Successor) 。 

这 样 的 依赖 图 形成 了 任务 图 的 一 个 特例 。 任 务 图 一 般 会 包含 比 图 2. 2 更 多 的 信 
息 ， 如 它们 会 包含 如 下 扩展 信息 : 

Q 时 序 信息 : 任务 可 能 有 启动 时 间 、 死 限 (Deadlines) 、 周 期 与 执行 时 间 。 为 
了 在 计算 的 调度 中 也 将 这 些 因 素 考虑 进去 ， 那 么 将 这 些 信 息 也 包含 在 依赖 图 中 就 非 
常 有 用 了 。 使 用 Liu [Liu, 2000] 所 著 书 中 的 方法 ， 在 图 2. 3 中 包含 了 可 能 的 执行 
时 间 间 隔 。 对 7, ALT, 的 计算 是 独立 进行 的 , 括号 on ug eo 
中 的 第 一 个 数字 表示 了 任务 的 启动 时 间 ， 第 二 个 E) 可) E) 
数字 表示 死 限 (图 2.3 中 没有 标明 执行 时 间 ) 。 如 
T, 应 该 在 时 刻 0 开始 ， 同 时 其 应 该 最 晚 在 时 刻 7 图 2.3 包含 时 序 信息 的 图 
结束 。 

事实 上 ， 更 多 复杂 的 计算 时 序 与 依赖 都 可 以 引入 到 图 2. 3 中 。 

D 计算 模块 之 间 不 同 关系 的 区 别 : 优先 级 关系 是 对 可 能 的 执行 顺序 约束 的 建 
模 。 更 进一步 讲 ， 它 对 于 区 分 计算 的 调度 约束 与 通信 约束 非常 有 用 。 通 信 可 以 用 边 
来 描述 ， 但 对 于 每 一 个 边 ， 也 许 还 会 有 补充 的 信息 ， 如 通信 时 间 、 信 息 量 等 。 描 述 
优先 级 的 边 可 以 与 其 他 的 边 不 一 样 ， 因为 对 于 有 些 即 使 没有 信 息 交 换 的 模块 ， 计 算 
也 必须 按 顺 序 执行 。 

在 图 2.2 中 ， 并 没有 明确 描述 输入 与 输出 (1/0)。 这 意味 着 可 以 假定 图 中 的 
计算 没有 优先 级 关系 ， ee od 同时 ， 产 生 的 
输出 将 被 用 于 子 模块 的 输入 ， 只 有 计算 结束 后 ， 这 些 输出 才 是 可 用 的 。 对 于 输入 与 
输出 ， 通 常 党 都 需要 作出 明确 的 描述 为 了 实现 这 一 目标 ， 就 需要 另外 一 种 关系 。 使 
用 男 外 一 种 符号 [Thoen and Catthoor，2000] ， 它 以 部 分 填充 的 圆 环 来 表示 输入 与 
输出 。 在 图 2.4 中 ， 这 种 圆 环 表示 了 VO 的 边 。 

(3 对 资源 的 互 斥 访问 : 对 于 某 些 资 @) 

源 ， 要 求 各 个 计算 模块 对 其 访问 是 互 斥 


的 ， 如 对 于 一 些 /0 设备 ， 或 者 用 于 通 (Te) 
信 的 一 些 内 存 区 域 。 在 计算 调度 中 ， 必 © QT TE ©) 
须 考 虑 到 哪些 操作 需要 互 斥 。 这 些 信息 (Bm) 
对 于 系统 设计 非常 有 用 ， 如 它们 可 以 用 ee 
于 避免 优先 级 反 转 的 问题 。 在 图 2.4 
中 ， 同 样 也 包含 了 对 资源 互 斥 操 作 的 一 些 信息 。 

@ 周期 性 调度 : 许多 计算 过 程 ， 尤 其 是 数字 信号 处 理 ， 都 是 周期 性 的 。 这 意 
味 着 必须 很 仔细 地 区 分 任务 与 它 的 执行 [后 者 常 被 称 为 作业 (Job), [ Lin, 
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2000] ] 。 这 样 的 任务 调度 图 都 是 无 限 (ns) "© a T 
循环 的 。 图 2.5 展示 了 一 个 任务 图 ， 

EBE J, aE J, ,1 这 样 的 多 个 作业 。 图 2.5 含有 多 个 作业 的 图 


O 节点 层次 图 : 在 图 中 以 节点 

的 形式 来 描述 计算 的 复杂 度 ， 这 与 前 面 的 几 种 方式 会 有 一 些 差异 。- 方 面 ， 特 定 的 
计算 可 能 会 非常 复杂 ， 它 可 能 包含 上 千 行 的 程序 代码 。 另 一 方面 ， 程序 可 以 被 分 成 
很 多 个 小 的 程序 片段 ， 每 个 节点 只 与 一 个 操作 相对 应 。 节点 图 的 复杂 度 被 称 为 粒度 
( Granularity) 。 应 该 选择 哪 一 种 粒度 呢 ? 对 此 并 没有 一 个 通用 的 答案 。 某 些 情况 
下 ,粒度 可 能 要 越 大越 好 ， 如 将 每 个 节点 等 同 地 视 为 进程 ， 它 们 被 实时 操作 系统 
( RealTime Operation System，RTOS) 调度 ， 这 时 就 应 该 采用 大 的 粒度 ， 从 而 使 不 同 
进程 之 间 的 上 下 文 切 换 最 小 化 。 而 对 于 某 些 情况 ， 可 能 需要 以 一 个 节点 来 表示 单一 
的 操作 ， 如 在 节点 需要 与 硬件 或 软件 有 对 应 关系 时 。 如 果 一 系列 操作 [ 如 频繁 地 
使 用 DCT (Discrete Cosine Transform， 离 散 余弦 变换 ) ] 可 以 被 映射 到 特定 功能 的 
硬件 ， 则 它 不 应 该 使 用 包含 很 多 其 他 复杂 操作 的 


节点 来 表示 ， 而 是 应 该 以 适当 的 模型 独立 表示 。 (&) 

为 了 避免 对 粒度 频繁 改动 ， 节 点 层次 图 就 非常 有 
用 了 。 在 较 高 层 ， 节 点 可 以 表示 复杂 的 任务 ， 较 Om] 
低层 可 以 表示 一 些 基本 模块 8， 更 低 些 的 层 可 以 表 

示 一 些 计算 操作 。 图 2.6 展示 了 图 2. 2 中 的 层次 AG Kee 





如 上 所 述 ，MoC 可 以 根据 通信 模型 (以 任务 图 之 间 的 边 来 反映 ) 与 模块 之 间 
的 计算 模型 (以 任务 图 中 的 节点 来 反映 ) 进行 分 类 。 下 面 ， 将 介绍 这 些 模型 中 的 
典型 例子 : 

3) 通信 模型 ,下面 将 通过 讨论 来 区 分 两 种 通信 和 模型， 共享 内 存 (Shared Mem- 
ory) 与 消息 传递 (Message Passing) 。 对 于 其 他 一 些 通信 模型 (原子 通信 [ Bou- 
wmeester et al. ，2000 ] ) ， 不 在 本 书 的 讨论 范围 中 。 

O 共享 内 存 : 对 于 共享 内 存 ， 所 有 模块 都 去 访问 相同 的 内 存 区 域 ， 从 而 完成 
通信 。 

除非 对 某 个 共享 内 存 区 域 只 有 读 操作 ， 否 则 必须 考虑 多 个 模块 对 其 访问 时 的 互 
斥 。 对 于 必须 保证 互 斥 操作 的 程序 代码 ， 也 称 为 临界 段 (Critical Section) 。 有 很 多 
种 被 建议 的 方式 ， 都 可 以 保证 对 资源 的 互 斥 访问 : 如 信和 号 量 、 条 件 临界 段 、 条 件 监 
视 等 。 可 以 查阅 关于 操作 系统 的 书 (如 Stallings 的 相关 著作 [ Stallings, 2009]) 来 
了 解 这 些 方式 的 技术 细节 。 共享 内 存 的 通信 效率 比较 高 ， 但 对 于 在 硬件 上 没有 共享 





O ”基本 模块 可 以 理解 为 在 代码 的 每 个 分 支 进行 同 类 操作 。 
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内 存 的 多 核 处 理 器 ， 这 一 方式 的 实现 就 非常 困难 了 。 

Q 消息 传递 : 消息 传递 ， 包 含 了 消息 的 发 送 与 接收 过 程 。 即 使 处 理 器 没有 共 
享 内 在， 仍然 可 以 实现 消息 传递 。 但 是 需要 注意 的 是 ， 消 息 传递 的 效率 比 共享 内 存 
要 低 不 少 。 对 于 此 类 通信 ， 需 要 区 分 以 下 3 种 技术 : 

a. 异步 消息 传递 (Asynchronous Message Passing) , 或 称 为 非 阻 塞 通 信 (Non- 
blocking Communication) : 在 异步 消息 传递 模式 下 ， 模 块 通过 向 能 缓存 消息 的 通道 
(Channels) 发 送 消息 ， 发 送 方 不 需要 知道 接收 方 是 否 准备 好 接收 消息 。 在 现实 中 ， 
这 就 相当 于 发 送 一 封 信 或 一 封 电子 邮件 。 这 种 通信 方式 也 有 潜在 的 问题 ; 发 送 的 消 
上 县 需要 被 缓存 ， 而 消息 缓冲 区 可 能 会 溢出 。 这 种 通信 调度 方式 还 有 很 多 个 版 本 ， 如 
通信 有 限 状 态 机 与 数据 流 模型 。 

b. 同步 消息 传递 (Synchronous Message Passing) ， 或 称 为 阻塞 通信 (Blocking 
Communication) 、 基 于 会 合 的 通信 (Rendezvous Based Communication) : 在 阻塞 通信 
模式 中 ， 模 块 基于 原子 操作 进行 通信 ， 这 种 即时 行为 被 称 为 会 合 ( Rendezvous ) 。 
通信 的 一 方 ， 必 须 等 待 相应 的 另 一 方 也 同时 准备 好 。 这 种 通信 模式 ， 在 现实 生活 中 
就 像 是 会 面 或 是 打 电 话 一 样 。 它 没有 缓冲 区 溢出 的 风险 ， 但 通信 效率 会 受到 影响 。 
基于 这 种 模式 的 语言 如 CSP 和 ADA, 

c. 扩展 的 会 合 模式 、 远 程 调用 (Extended Rendezvous, Remote Invocation): 在 
这 种 模式 下 ， 发 送 方 只 有 在 收 到 来 自 接收 方 的 应 答 后 ， 才 能 继续 执行 后 续 过 程 。 在 
收 到 消息 后 ， 接 收 方 不 一 定 需要 马上 产生 应 答 ， 可 以 在 对 消息 进行 一 些 初步 检查 
后 ， 再 发 送 应 答 信号。 

4) 模块 间 计 算 的 组 织 : 

OD 汉 ' 诺 依 曼 模型 (von- Neumann Model) : 这 种 模型 基于 对 有 序 的 独立 计算 
的 顺序 执行 。 

D 离散 事件 模型 (Discrete Event Model); 在 这 种 模型 中 ， 事 件 都 携带 着 有 序 
的 时 间 戳 ， 从 而 表明 了 事件 的 发 生 时 间 。 离 散 事件 仿真 器 一 般 都 有 一 个 全 局 的 事件 
队列 ， 按 顺序 存储 着 多 个 事件 ， 这 些 事件 也 会 按 存储 顺序 被 处 理 。 这 种 模型 的 缺 
点 ， 就 在 于 它 依赖 于 来 自 事件 队列 的 全 局 通知 序列 ， 很 难 将 其 转化 为 并 行 语 言 的 实 
现 。 如 VHDL, SystemC 以 及 Verilog, 

© 有 限 状态 机 (Finite State Machine, FSM); 这 种 模型 依赖 于 有 限 状 态 机 的 通 
知 、 输 入 、 输 出 ， 以 及 状态 机 的 转变 。 多 个 状态 机 之 间 进 行 的 通信 ， 称 为 通信 有 限 
状态 机 (Communication Finite State Machine, CFSM) 。 

@ AT (Differential Equation) : 微分 方程 很 适合 对 模拟 电路 以 及 物理 系 
统 进行 建 模 。 它 们 也 可 以 用 于 对 信息 一 物理 系统 建 模 。 

5) 组 合 模型 (Combined Model) : 实际 语言 一 般 都 结合 了 多 种 模型 ， 这 些 模 型 
内 的 多 个 模块 之 间 又 存在 着 不 同 的 通信 组 织 。 如 StateCharts 组 合 了 共享 内 存 的 有 限 
状态 机 ;SDL 结合 了 异步 通信 有 限 状态 机 ;ADA 与 CSP 结合 了 同步 消息 传递 的 
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Hy 诺 依 曼 模型 。 图 2. 7 列 出 了 在 本 章 将 继续 讨论 的 组 合 模型 ， 同 时 也 列 出 了 针对 
大 部 分 MoC 的 语言 。 



































模块 的 通信 组 织 共享 内 存 消息 传递 
了 
未 定义 的 模块 纯 文 本 或 图 ， 用 例 (消息 ) 时 序 图 
2 
ro StateCharts SDL 
S 到 | 

数据 流 (未 使 用 ) aes 

Petri nets ‘a | C/E nets, P/T nets, + 
© VHDL, Verilog, ( 仅 在 成 熟 系统 中 ) 

离散 事件 (DE) 模型 SystemC 在 Ptolemy 中 的 分 布 式 DE 

Cy. CHR vote 
53. 诺 依 曼 模型 | Cy C++、 Java CSP, “ADA | 








图 2.7 MoC 概述 与 备 选 语言 
O 对 于 VHDL、Verilog 与 SystemC 的 分 类 ， 基于 这 些 语 言 在 模拟 器 中 的 应 用 情况 。 在 模拟 
器 内 核 的 “顶层 " ， 可 以 对 消息 传递 进行 建 模 。 





不 同 的 MoC 有 其 不 同 的 擅长 应 用 领域 ， 针 对 某 一 应 用 领域 ， 选 择 “最 好 ”的 
MoC 往往 比较 困难 。 使 用 混合 MoC (如 [ Davis et al. , 2001] 描述 的 Ptolemy HE 
R) 也 许 是 一 种 比较 好 的 选择 。 同 时 ， 模 型 也 许 需 要 从 一 种 MoC 转变 为 另 一 种 ， 
FEV + 诺 依 曼 模型 常常 转变 为 汉 ， 诺 依 曼 模 型 。 如 果 从 两 种 模型 之 间 相互 转化 比较 
容易 ， 那 么 也 就 意味 着 可 以 较 少 地 关注 模型 之 间 的 差异 。 

MARD - 诺 依 曼 模型 开始 的 设计 常 被 称 为 基于 模型 的 设计 (Model- based De- 
sign) 。 基 于 模型 的 设计 的 关键 想法 ， 即 得 到 设计 中 的 系统 (System Under Design , 
SUD) 的 一 些 抽象 模型 ， 然 后 可 以 基于 这 些 模型 来 研究 系统 的 各 种 特性 ， 但 并 不 关 
心软 件 代 码 。 在 模型 被 逐步 细 化 明晰 之 后 ， 软件 代码 就 随 之 很 自然 地 得 到 了 实现 。 
关于 “基于 模型 的 设计 ”并 没有 一 个 精确 的 定义 ， 它 常 与 控制 系统 相关 ， 包 含 一 
些 传统 的 控制 组 件 ， 如 微分 器 、 积 分 器 等 。 但 这 种 观点 太 过 严格 ， 因为 同样 可 以 从 
消费 系统 进行 抽象 。 

接 下 来 ， 将 对 不 同 的 MoC 进行 讲述 ， 使 用 现 有 语言 来 展示 它们 的 特性 。Ed- 
wards [Edwards, 2006] 提供 了 一 份 相 关 的 调查 报告 (但 比较 简短 )， 同时 更 多 的 
资料 可 以 参见 [Gomez and Fernandes, 2010 ] 。 





2.3 早期 设计 阶段 


关于 系统 的 最 初 想法 一 般 都 以 非 正式 的 方式 进行 记录 ， 如 在 几 张 简单 的 纸 上 。 
通常 ， 在 项 目 设计 的 早期 阶段 ， 都 是 以 英语 、 日 语 这 类 自然 语言 来 对 SUD 进行 描 
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述 ， 一 般 都 是 日 常 使 用 的 文件 格式 。 这 些 描述 最 终 都 应 该 以 可 使 用 计算 机 处 理 的 格 
式 记 录 下 来 ， 它 们 需要 用 一 些 文字 处 理 软件 进行 加 工 ， 并 且 使 用 工具 来 管理 这 些 文 
档 。 优 秀 的 管理 工具 在 进行 版 本 管理 的 同时 ， 也 能 维护 需求 与 依赖 分 析 等 之 间 的 链 


接 关 系 。 
DOORS® [IBM, 2010b] 就 是 这 样 一 种 工具 。 
2.3.1 用 例 


对 于 一 些 应 用 ， 针 对 SUD 预先 设计 一 些 可 能 的 使 用 场景 会 非常 有 用 。 这 样 的 
一 些 使 用 场景 ， 称 之 为 用 例 (Use Case) ， 用 例 描述 了 SUD 的 可 能 应 用 。 不 同 的 用 
例 应 当 使 用 不 同 的 标记 。 

UML (Unified Modeling Language， 统 一 建 模 语 言 ) 标准 [ Object Management 
Group (OMG), 2010b] [Fowler and Scott，1998] [Haugen and Moller- Pedersen , 
2006] 常常 被 用 于 系统 早期 的 规范 设计 阶段 。UML 由 一 群 软 件 技术 专家 设计 ， 并 
且 由 商业 工具 支持 。UML 的 主要 目标 是 对 软件 设计 流程 进行 支持 ， 它 也 针对 用 例 
提供 了 标准 化 的 框架 。 

从 设计 者 的 角度 ， 很 难 对 用 例 进 行 精确 计算 或 者 通信 建 模 。 一 方面 来 自 于 建 模 
本 身 的 难度 ， 另 一 方面 却 有 可 能 是 故意 为 之 ， 其 目的 是 为 了 避免 在 设计 早期 过 多 关 
注 细节 ， 这 也 是 常常 存在 争议 的 地 方 。 

如 图 2. 8 展示 了 为 一 个 电话 应 答 机 设计 的 用 例 9 ; 


播放 下 一 条 信息 > 


清除 上 一 条 信息 










































用 户 
清除 所 有 信息 D> 
打开 管 录 机 ioe a 
关闭 答 录 机 > 
开机 音 + 提 示 音 + 语音 信箱 





图 2.8 用 例 的 例子 


基于 SUD 对 应 用 的 支持 ， 用 例 将 不 同 的 用 户 进 行 分 类 ， 从 而 可 以 在 较 高 的 抽 
象 层 次 上 收集 使 用 者 的 期 望 。 





O 假定 UML 已 经 在 软件 工程 学 的 课程 中 进行 了 深入 介绍 ， 因 此 在 本 书 中 不 作 过 多 讨论 。 
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2.3.2 (AA) 序列 图 


在 更 细 化 的 层次 上 ， 为 了 应 用 一 些 SUD 的 用 例 ， 和 希望 明确 地 标识 出 模块 之 间 
必要 的 通信 消息 序列 。 序 列 图 (Sequence Charts，SC) ， 其 在 早期 也 被 称 为 消息 序 
列 图 (Message Sequence Charts ，MSC) ， 它 就 提供 了 这 样 的 机 制 。 序 列 图 使 用 二 维 
图 中 的 一 维 (一 般 是 竖 轴 ) 来 标识 序列 ， 第 二 维 表示 不 同 的 通信 模块 。SC 描述 了 
消息 传输 的 部 分 时 序 ， 同 时 也 展示 了 SUD 的 可 能 行为 。 
























































SC 是 UML 标准 化 的 模块 之 一 。 相 对 于 UML1.0，UML2.0 扩展 了 SC 的 功能 ， 
允许 对 组 件 进行 更 加 详细 的 描述 。 图 2. 9 展示 了 一 个 电话 应 答 机 的 例子 。 
电话 电话 应 答 机 | 
[| 输入 呈 码 i | 
呼叫 信号 : 
接听 信号 ME 
vies | 接听 确认 
一 一 
aas 传送 提示 音 
语音 信箱 Saree 
返回 手工 设置 | 
L "i 呼叫 结束 信号 
呼叫 电话 应 答 机 











图 2.9 电话 应 答 机 的 UML 模型 


虚线 被 称 为 “时 间 线 ”， 消 息 在 时 间 线 上 是 有 序 排列 的 。 在 本 例 中 ， 假 定 所 有 
的 信息 都 是 以 消息 的 形式 传送 的 。 图 中 的 箭头 表示 了 异步 传送 的 消息 ， 即 在 这 类 消 
息 的 传送 中 ， 发 送 方 不 必 等 竺 来 自 接收 方 的 确认 ， 它 可 以 发 送 多 条 消息 。 本 例 中 的 
应 答 机 根据 设 定 的 时 间 等 竺 用户 接 听 电 话 ， 如 果 超 过 设 定时 间 后 仍然 无 人 接听 ， 则 
应 答 机 将 自动 接听 并 向 呼叫 方 发 送 自动 应 答 提 示 ， 此 时 呼叫 者 可 以 留言 。 其 他 一 些 
时 序 (如 呼叫 者 提前 结束 通话 ， 或 者 被 叫 者 接听 了 电话 ) 并 未 在 此 处 列 出 。 

SC 并 不 适合 描述 基于 控制 的 复杂 行为 ， 这 时 需要 使 用 一 些 其 他 的 MoC。 通 常 
需要 适合 一 些 先决 条 件 时 才能 采用 SC， 这 种 先决 条 件 ， 可 能 发 生 的 时 序 与 必然 发 
生 的 时 序 之 间 的 区 别 ， 以 及 其 他 一 些 扩展 场景 ， 被 称 为 真实 序列 图 (Live Sequence 
Charts) [Damm and Harel, 2001 ] 。 

时 间 / 距 离 图 (Time/Distance Diagrams, TDD) 是 SC 一 种 常见 变化 形式 , 在 
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TDD 中 ， 竖 轴 不 仪表 示 序 列 ， 还 表示 了 真实 时 间 。 在 某 些 情况 下 ， 横 轴 同 时 代表 
着 模块 之 间 的 真实 距离 。 

TDD 为 列车 或 公共 汽车 的 调度 提供 了 最 准确 的 虚拟 模型 。 图 2. 10 就 是 这 样 的 
实例 。 





科隆 WR 阿姆斯特丹 。 布鲁塞尔 巴黎 








图 2.10 TDD 


图 2. 10 中 的 例子 展示 了 在 阿姆斯特丹 、 科 隆 、 布 鲁 塞 尔 以 及 巴黎 之 间 的 列车 
调度 过 程 。 列 车 可 以 从 阿姆斯特丹 或 者 科隆 出 发 ， 经 过 布鲁塞尔 到 达 巴 黎 ， 亚 琛 是 
科隆 与 布鲁塞尔 之 间 的 一 个 中 转 站 。 坚 轴 相 应 地 表示 了 各 站 点 之 间 经 历 的 时 间 。 从 
图 中 可 知 ， 来 自 科隆 与 阿姆斯特丹 的 列车 会 同时 到 达 布 鲁 塞 尔 ， 巴 黎 与 科隆 之 间 还 
有 一 趟 经 过 阿姆斯特丹 的 列车 ， 但 它 不 属于 阿姆斯特丹 车 站 。 

本 例 以 及 其 他 一 些 类 似 例 子 ， 都 可 以 使 用 levi 仿真 软件 来 进行 仿真 [ Sirocic 
and Marwedel, 2007d], Al2.11 展示 了 规模 更 大 、 更 加 真实 的 例子 ， 它 [ Huerli- 
mann, 2003] 描述 了 瑞士 洛 书 堡 (Litschberg) 地 区 的 铁路 交通 情况 。 快 车 与 慢车 
在 图 中 以 它们 的 斜率 来 进行 区 分 ， 这 种 建 模 的 技术 在 现实 中 非常 常见 。 











MZ œ a Ea E xo = 
rž F A Go o <0 205 
EG & Rze 3 5S A F n SS SA 
10. 00 r 10.00 
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50 50 
11.00 z 11.00 
.10 .10 
20% 20 
30 | .30 
40 es, 40 
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图 2.11 TDD 展示 的 铁路 交通 (H. Brändli, IVT, ETH Zürich) © ETH Zürich 
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对 比 图 2.9 与 图 2. 11 ， 两 者 的 关键 区 别 在 于 图 2. 9 并 不 能 反映 真实 时 间 。UML 
的 设计 初衷 也 并 不 包含 对 实时 应 用 的 支持 ， 但 UML2. 0 已 经 包含 了 时 序 图 (Timing 
Diagrams) 功能 ， 它 允许 与 真实 时 间 进 行 关联 。 这 样 的 UML “H” eE, RF 
对 时 间 进 行 更 多 的 注解 ，[ Martin and Miiller，2005] [ Müller, 2007 | 。 

TDD 很 适合 于 对 一 些 典型 调度 进行 描述 ， 但 SC 与 TDD 却 不 能 对 模型 中 的 同步 
信息 进行 很 好 地 描述 。 如 在 2. 10 所 示 的 例子 中 ， 无 从 得 知 列车 在 布鲁塞尔 的 相遇 ， 
是 出 于 巧合 ， 或 者 是 为 了 同步 调度 的 需要 。 同 时 ， 也 很 难 从 图 中 表达 的 时 序 (最 
小 /最 大 时 序 行为 ) 中 得 到 允许 误差 。 





2.4 通信 有 限 状 态 机 


如 果 和 希望 在 更 清晰 的 层次 来 描述 SUD, 
则 需要 更 加 精确 的 模型 。 在 本 章 开 始 ， 就 
提 到 了 需要 描述 状态 机 行为 。 状 态 图 是 状 
态 机 行为 描述 的 经 典 方式 ， 图 2. 12 (与 图 
2.1 相同 ) 展示 了 经 典 状 态 图 的 例子 ， 即 有 
限 状态 机 (Finite State Machine, FSM) 。 图 2. 12 状态 图 

在 图 2. 12 中 ,圆圈 代表 着 不 同 的 状 
态 。 如 果 假 定 FSM 中 只 有 一 个 状态 是 处 于 活动 态 ， 这 样 的 FSM 称 为 确定 性 
(Deterministic) FSM。 边 表示 状态 的 改变 ， 边 上 的 符号 表示 事件 。 假 定 FSM 中 有 多 
个 状态 处 于 活动 态 ， 从 边 引出 的 方向 上 ， 发 生 了 边 上 的 符号 事件 ， 则 FSM 将 从 当 
前 的 活动 态 转变 到 边 所 指向 的 终点 状态 。 有 些 FSM 是 受 时 钟 驱 动 的 ， 这 样 的 FSM 
称 为 同步 FSM (Synchronous FSM) 。 对 于 同步 FSM， 只 有 在 时 钟 跳 变 时 ， 状 态 才能 
发 生 改 变 。FSM 同样 可 以 产生 输出 (未 在 图 2. 12 中 体现 ) 。 对 于 经 典 的 FSM, E 
多 内 容 请 参考 如 Kohavi [Kohavi, 1987] 等 人 的 著作 。 


2.4.1 时 间 自 动机 


传统 的 FSM 不 提供 与 时 间 相关 的 信息 ， 为 了 在 模型 中 包含 时 间 参 数 ， 传 统 的 
FSM 进行 了 相应 的 功能 扩展 。 时 间 自 动机 (Timed Automata) 在 本 质 上 是 自动 扩展 
为 带 实际 值 的 变量 。“ 变 量 反映 了 系统 中 的 逻辑 时 钟 数 ， 它 们 的 值 在 系统 初始 化 时 
都 是 零 ， 而 后 按 相 同 的 节奏 增长 。 时 钟 约束 ， 如 对 时 钟 沿 的 控制 ， 常 用 于 控制 自动 
机 的 行为 。 当 时 钟 的 值 与 边 上 标明 的 数值 一 致 时 ， 状 态 将 发 生 改 变 ， 此 时 时 钟 可 能 
被 复位 为 零 ”[ Bengtsson and Yi, 2004], 

图 2. 13 展示 了 这 样 一 个 例子 。 

应 答 机 在 启动 后 即 处 于 最 左边 的 状态 ， 当 有 呼叫 信号 时 ， 时 钟 x 复位 为 0， 应 
答 机 转 信 等待 状 态 ， 此 时 被 叫 者 提起 受 话 器 即 可 开始 对 话 ， 而 后 挂机 。 如 果 被 叫 者 
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返回 手动 设置 








图 2. 13 电话 应 答 机 中 的 呼叫 服务 示例 


在 经 历时 间 值 4 后 仍然 未 接听 ， 则 转 人 语音 播放 状态 。 

在 进入 语音 播放 状态 后 ， 将 播放 一 段 以 提示 音 为 结束 的 语音 信息 。 时 间 y 保证 
了 提示 音 至 少 会 播放 一 次 ， 而 后 时 间 * 再 次 复位 到 0， 同 时 应 答 机 进入 准备 记录 状 
态 。 如 果 时 间 值 到 达 8， 或 者 呼叫 者 一 直 没 有 操作 ， 则 再 播放 一 次 提示 音 ， 同 样 至 
少 需要 播放 一 次 。 此 后 进入 终止 状态 ， 在 本 例 中 ， 状 态 的 改变 可 能 是 由 于 输入 导致 
的 《如 接听 ) ,或 者 是 因为 时 间 约 束 (Clock Constraints) 引起 的 超时 。 

时 间 约 束 描述 了 一 些 有 可 能 发 生 的 状态 迁移 ， 但 它们 也 有 可 能 不 会 发 生 。 为 了 
确保 状态 的 变化 ， 需 要 定义 一 些 局 部 常量 。 本 例 中 使 用 了 <5, x<9 和 y <2 这 样 
的 局 部 常量 ， 从 而 保证 在 使 能 条 件 为 真 后 ， 状 态 的 转换 会 在 限制 的 时 间 之 内 产生 。 
一 般 只 会 使 用 一 个 时 间 约束 条 件 ， 仅 在 作 一 些 证 明 问 题 时 才 使 用 两 个 时 间 约束 。 

时 间 自 动机 的 正式 定义 如 下 [Bengtsson and Yi, 2004]: 

假设 C 是 表示 时 间 的 非 负 实数 集合 ， 也 是 有 限 的 输入 集合 。 
定义 : 时 间 约束 可 以 用 公式 表达 : xon 或 (x-y)on, 其 中 x, yeC, oe|<， 
<, =, >, >} 同时 neNWN。 

虽然 时 间 可 以 是 实数 ， 但 此 处 使 用 的 n 必须 是 整数 。 扩 展 到 有 理 数 也 很 简单 ， 
只 需要 经 过 简单 的 乘法 即 可 。 假 定 B(C) 是 时 间 约 束 的 集合 。 
定义 [ Bengtsson and Yi, 2004]: 时 间 自 动机 是 这 样 的 一 个 元 组 CS, Syo E Ta 
其 中 : 

1) $ 是 有 限 状态 的 集合 ; 

2) so 是 初始 状态 ; 

3) ECSxB(C) xd x2 xS 是 边 的 合集 ，B(C) 是 一 系列 组 合 场景 ，5 是 转 
换 发 生 需 要 的 输入 条 件 ，2“ 是 当 转 换 发 生 时 会 被 重 置 的 时 间 变 量 ; 

4) 1: 5 一 B(C) 是 每 个 状态 的 常量 集合 ，B( C) 是 对 某 个 特定 状态 S 必须 保持 
的 常量 ， 这 些 常 量 以 公式 的 形式 描述 。 

时 间 自 动机 常常 需要 用 第 一 个 定义 来 辅助 说 明 ， 它 有 很 多 时 间 因素 ， 因 此 很 难 
理解 。 关 于 时 间 自动 机 的 更 多 资料 ， 可 以 参考 Dill 等 人 [Dil and Alr, 1994] 与 
Bengtsson 等 人 [Bengtsson and Yi, 2004] 的 系列 论文 。 
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时 间 自 动机 在 传统 的 自动 机 的 基础 上 ， 增 加 了 更 多 的 时 间 信 息 。 但 是 时 间 自 动机 却 并 
不 能 完全 满足 人 们 对 特定 实现 的 要 求 ， 尤 其 是 它 不 能 提供 层次 性 与 并 发 性 的 架构 描述 。 


2.4.2 ”状态 图 : 隐 性 共享 内 存 通信 


状态 图 是 结合 了 自动 机 原理 的 典型 语言 ， 它 同时 也 支持 分 层 与 并 行 设计 ， 但 它 
在 对 时 间 的 描述 方面 能 提供 的 方式 很 有 限 。 

状态 图 由 David Harel [ Harel，1987] 在 1987 年 首先 进行 了 介绍 ， 而 后 又 进行 
了 更 加 准确 的 描述 [ Drusinsky and Harel, 1989] 。 根据 Harel 的 说 法 ， 状 态 图 这 一 
名 称 的 选取 ， 来 源 于 它 是 “惟一 一 种 没有 将 图 表 与 流程 或 状态 结合 的 方式 ”， 
2.4.2.1 分 层 架 构 的 建 模 

状态 图 语言 是 对 FSM 的 扩展 ， 扩 展 的 关键 点 即 层次 化 ( Hierarchy) 。 状 态 图 可 
以 用 于 对 基于 状态 机 的 行为 进行 建 模 。 

我 们 可 以 超 状 态 (Super- States) 来 描述 分 层 架 构 。 
定义 : 

1) 包含 多 个 其 他 状态 的 $ 为 超 状 态 。 

2) 被 包含 的 子 状态 称 为 超 状态 的 子 状态 (Sub- State) 。 


图 2.14 是 一 个 状态 图 的 示例 ， 它 是 
图 2. 12 的 分 层 架 构图 示 。 | 





超 状态 SMET A. B.C. DL ES 
个 子 状态 。 假 定 FSM 处 在 状态 Z [ Z 也 被 
称 为 活动 态 (Active State) ] ， 如 果 在 FSM 





加 








中 加 上 输入 m,， 则 4 与 5 将 成 为 新 的 活动 2 
态 。 如 果 FSM 处 在 状态 $5， 此 时 加 上 输入 图 2. 14 层次 化 的 状态 图 


k, TE FSM 是 处 在 S 中 的 4、B、C、D 
CEE, Z 都 将 成 为 新 的 活动 态 。 在 本 例 中 ， 组 成 超 状 态 S 的 所 有 子 状态 都 是 非 分 
JRR, BEK S 中 的 子 状态 仍然 可 以 再 包含 自己 的 子 状态 。 当 超 状 态 中 的 任 一 
子 状态 处 于 活动 态 时 ， 超 状态 也 处 于 活动 态 。 
定义 : 

1) 一 个 不 再 包含 其 他 状态 的 状态 ， 称 其 为 基本 态 (Basic State) ; 

2) 对 于 基本 态 $5， 其 超 状 态 被 称 为 父 始 态 (Ancestor State) 。 

在 图 2.14 中 ，FSM 在 任意 时 间 只 能 处 于 超 状 态 5 的 子 状态 之 一 ， 这 样 的 父 状 
态 称 为 OR 超 状态 2 。 





〇 ”更 精确 地 ， 它 们 应 该 被 称 为 XOR 超 状 态 ， 因 为 FSM 可 能 存在 于 4、B、C、D、 之 一 上 , 但 此 术语 
在 本 书 中 极 少 使 用 。 
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在 图 2. 14 中 ,可 以 被 认为 是 一 种 异常 ， 从 而 状态 从 5 处 发 生 了 跳 转 。 图 
2. 14 也 展示 了 状态 图 可 以 对 异常 信息 进行 较为 紧凑 的 描述 。 

状态 图 可 以 对 包含 多 个 子 系统 的 分 层 系统 进行 描述 ， 这 些 子 系统 仍然 可 以 包含 
更 小 的 子 系统 。 整 个 系统 的 层次 被 称 为 树 (Tree) ， 树 根 相当 于 整个 系统 ， 内 部 的 
节点 相应 于 分 层 的 描述 符 〈 在 状态 图 中 被 称 为 超 节点 ) ， 系 统 树 上 的 叶子 则 相应 于 
非 分 层 描 述 符 〈 称 为 基本 态 ) 。 

现 目前 为 止 ， 一 直 使 用 明确 而 直接 的 边 来 表示 下 一 个 状态 ， 这 样 做 的 缺点 是 无 
法 对 外 屏蔽 超 状 态 的 内 部 结构 。 但 在 真正 分 层 架 构 中 ， 又 常常 需要 这 样 做 ， 使 超 状 
态 内 部 的 改变 不 会 影响 到 其 他 架构 。 当 然 ， 使 用 其 他 一 些 机 制 来 描述 下 一 个 状态 是 
可 以 解决 这 个 问题 的 。 

第 一 种 补充 机 制 是 默认 状态 机 制 A 


(Default State Mechanism) ， 它 可 以 被 用 
于 超 状态 ， 从 而 表示 当 超 状态 处 于 活动 o T e 
态 时 ， 特 定 的 子 状 态 也 将 处 于 活动 态 。 Q {y iS a 
在 状态 图 中 ， 默 认 状 态 以 一 个 小 的 实心 ao 
圆 来 表示 ， 实 心 圆 其 自身 不 包含 任何 状 
态 。 图 2. 15 展示 了 默认 状态 机 制 的 使 图 2. 15 ”使 用 默认 状态 机 制 的 状态 图 
用 ， 它 与 图 2. 14 是 等 同 的 。 
历史 机 制 (History Mechanism) 是 指定 下 一 个 状态 的 另 一 种 机 制 。 它 可 以 在 超 


状态 跳 转 前 ， 较 容易 地 返回 到 上 一 个 处 于 活动 态 的 子 状态 。 历 史 机 制 使 用 一 个 带 有 
圆圈 的 字母 H 来 表示 。 为 了 表示 入 


一 个 超 状 态 的 最 原始 状态 ， 历 史 机 | 
制 常 与 默认 机 制 结合 使 用 。 图 ev NG) 
2. 16 展示 了 这 样 的 一 个 例子 。 — 























HE, FSM 的 行为 就 有 一 些 m 
不 一 样 了 。 当 系统 正 处 于 Z 时 加 
上 输入 m， 如 果 是 第 一 次 进入 S， 图 2. 16 使 用 默认 状态 与 历史 状态 机 制 的 状态 图 
则 FSM Sit AMA A, BUEH 
进入 上 次 从 5 跳 转 时 的 状态 。 这 种 机 制 有 很 多 应 用 ， 如 使 用 来 代表 异常 ， 就 
可 以 使 用 输入 m 来 返回 异常 发 生 时 的 系统 状态 。 状 态 4、B、C、D、E 可 以 将 
Z 视 作 一 个 子 程序 ， 当 完成 这 个 “ 子 程 序 ”2Z 后 ,将 返回 到 调用 子 程序 的 


状态 。 
图 2. 17 对 图 2. 16 进行 了 重新 描述 ， 在 此 处 结合 使 用 了 默认 状态 机 制 与 历史 
机 制 。 


实践 中 ， 还 需要 能 方便 地 对 系统 的 并 发 性 进行 描述 的 技术 。 为 了 解决 这 一 问 
题 ， 状 态 图 语言 提供 了 第 二 种 超 状态 ， 称 为 AND 超 状态 。 
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定义 : 如 果 系 统 包含 的 状态 S 在 其 [sl 


所 有 子 状态 中 一 直 存在 ， 则 称 超 状 
态 5 WAND 超 状态 。 | EOOH D| 
k 














以 包含 AND 超 状 态 模型 的 电 
话 应 答 机 为 例 ， 如 图 2. 18 所 示 。 “~A 
电话 应 答 机 一 般 需 要 并 行 完 成 
两 个 任务 : 监听 呼 入 线路 、 等 待 用 图 2.17 综合 历史 与 默认 状态 机 制 的 图 


户 按键 操作 。 在 图 2. 18 中 ， 这 两 

个 相应 任务 的 状态 为 Lwait 与 Kwait。 被 呼叫 后 则 进入 状态 Lproc 进行 处 理 ， 同 时 在 
Kproc 状态 中 等 待 用 户 的 按键 操作 。 在 系统 最 初 状 态 时 ， 假 定 开 / 关 按键 的 状态 
(一 般 对 应 着 on 与 of 键 ) 是 不 一 样 的 ， 此 时 按键 操作 不 会 进入 Kproc 态 。 在 
“off” 被 按 下 时 ， 只 有 在 重新 按 “on” 后 ， 才 会 重新 进入 呼 人 线路 监听 状态 与 按键 
等 待 状态 。 此 时 ， 系 统 也 进入 默认 的 Lwait 与 Kwait 状态 。 当 开关 处 于 “on” 时 ， 
系统 将 一 直 处 于 呼 入 线路 监听 状态 与 按键 等 待 状态 。 

电话 应 答 机 


开 
呼 入 监听 





























挂机 
(呼叫 方 ) 














图 2.18 电话 应 答 机 


对 于 AND 超 状态 ， 因 其 子 状态 的 改变 而 触发 的 事件 都 是 可 以 明确 定义 的 。 这 
些 子 状 态 可 以 是 历史 状态 与 默认 状态 的 组 合 ， 并 且 子 状态 会 发 生 明确 的 转换 。 即 使 
子 状态 之 中 只 有 一 个 发 生 了 转换 ， 所 有 的 子 状态 都 需要 全 部 重新 进入 ， 理 解 这 一 点 
非常 重要 。 相 应 地 ， 从 AND 超 状 态 中 跳 转 到 另 一 状态 时 ， 所 有 的 子 状 态 也 将 发 生 
跳 转 。 

假如 修改 一 下 电话 应 答 机 ， 使 其 开 / 关 按键 像 其 他 开关 一 样 ， 也 由 Kproc 状态 
进行 解码 〈 见 图 2. 19). 

开 / 关 按键 的 操作 由 Kwait 进行 检测 ， 假 定 首先 进入 状态 Kproc， 而 后 进入 off 
状态 ， 这 种 转换 也 将 导致 系统 从 呼 人 监听 状态 跳 转 。 重 新 打开 应 答 机 将 导致 系统 重 
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电话 应 答 机 

















开 
( 呼 入 监听 


S 响 铃 
| 挂机 
NX 








按键 监听 








(呼叫 方 ) 

















图 2.19 电话 应 答 机 经 修改 的 开 / 关 按键 处 理 流程 


新 进入 呼 人 监听 状态 。 

AND 超 状态 以 状态 图 的 方式 提供 了 对 并 行 处 理 进行 描述 的 关键 机 制 。 每 个 子 
状态 都 可 以 看 作 独 立 的 状态 机 ， 它 们 之 间 彼 此 通信 ， 组 成 了 通信 有 限 状 态 机 (CF- 
SM) 。 这 个 术语 已 经 被 用 作 了 本 章 的 标题 。 

小 结 一 下 ， 状 态 图 中 的 状态 机 可 以 是 AND 状态 、OR 状态 或 基本 状态 之 一 。 
2.4.2.2 定时 器 

出 于 对 授 入 式 系统 中 时 间 进行 建 模 的 需要 ， 状 态 图 也 提供 了 对 定时 器 进行 描述 
的 方法 。 定 时 器 使 用 图 2. 20 中 的 符号 ( 左 侧 ) 进行 表示 。 


a 
“Jaf | 


图 2. 20 状态 图 中 的 定时 器 





系统 在 某 个 状态 经 过 定时 器 指定 的 时 间 后 ， 即 发 生 超时 ， 而 系统 将 退出 当前 状 
态 。 定 时 髓 同样 也 可 以 被 用 于 分 层 架 构 的 设计 。 

在 电话 应 答 机 中 ， 定 时 器 可 用 于 在 较 低 层次 上 去 描述 Lproe 的 行为 。 图 2.21 
展示 了 Lproc 的 可 能 行为 。 这 里 指定 的 时 序 与 图 2. 13 有 微小 的 区 别 。 

在 图 2. 18 中 ， 对 于 如 呼叫 方 挂机 的 异常 情况 ,一旦 呼叫 方 挂机 ， 则 Lproc 也 
同时 终止 。 对 于 来 自 被 叫 者 的 挂机 行为 ，Lproc 的 状态 设计 可 能 会 引起 一 些 不 便 ， 
如 果 被 叫 者 先 挂机 ， 则 电话 将 失灵 (同时 静音 ) ， 一 直到 呼叫 者 也 挂机 。 

状态 机 语言 包含 了 许多 其 他 语言 元 素 : 完整 的 资料 可 以 参考 Harel 的 研究 
[ Harel，1987] 。 关 于 状态 机 语言 的 详细 语法 ， 可 以 参考 Drusinsky 与 Harel [ Drus- 
insky and Harel, 1989] 的 相关 著作 。 
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图 2.21 Lproc 对 呼 入 的 处 理 


2.4.2.3 标识 符 与 StateMate 语义 

目前 为 止 ， 还 没有 考虑 过 基于 扩展 的 FSM 产生 的 输出 ， 这 些 输出 可 以 使 用 标 
识 符 来 进行 指定 。 标 识 符 的 格式 一 般 是 “event [ condition ] /reaction”， 这 三 部 分 
都 是 可 选 的 。reaction 描述 了 FSM 对 状态 转换 的 反应 ， 如 产生 一 些 事件 ， 或 者 对 一 
些 变量 赋值 。condition 部 分 描述 了 变量 处 于 何 值 以 及 系统 当时 处 于 何 种 状态 。event 
部 分 描述 了 发 生 的 事件 。 事 件 可 以 在 系统 内 部 或 外 部 产生 ， 内 部 事件 是 状态 转换 的 
结果 ， 它 用 标识 符 中 的 reaction 部 分 进行 反应 。 外 部 事件 则 常常 在 对 系统 外 部 环境 
的 模型 中 进行 描述 。 

例如 : 

1) on-key/on: =1 (测试 事件 与 变量 赋值 ) ; 

2) [on=1] (测试 条 件 需要 的 变量 值 ); 

3) off-key [not in Lproc]/on: =0 (测试 事件 ， 某 个 状态 的 测试 条 件 ， 变 量 赋 
值 。 当 事件 发 生 ， 并 且 测 试 条 件 也 满足 时 ， 将 发 生变 量 的 赋值 ) 。 

StateMate 是 一 种 商业 化 的 状态 图 实现 ， 标 识 符 在 StateMate 的 语义 全 文 [Drus- 
insky and Harel, 1989] 中 有 相应 讲解 。StateMate 假定 系统 是 按 描述 符 所 表示 的 步 
又 进行 的 ， 每 一 步 都 包含 3 个 阶段 : 

1) 在 此 阶段 ， 主 要 是 评估 外 部 的 一 些 改变 对 场景 及 事件 的 影响 ， 它 也 包含 对 
依赖 于 外 部 事件 的 某 些 功 能 的 评估 。 这 个 阶段 不 包含 任何 状态 改变 。 在 所 给 出 的 简 
单 示例 中 ， 这 个 阶段 并 不 是 必须 的 。 

2) 此 阶段 主要 是 预测 所 需要 作出 的 转换 ， 评 估 对 变量 的 赋值 ， 但 新 的 值 仅 赋 
给 临时 变量 。 l I 

3) 在 第 3 阶段 ， 状 态 改变 开始 生效 ， 并 且 变 量 将 使 用 新 的 值 。 

阶段 2 与 阶段 3 的 分 开 对 保证 StateMate 模型 的 可 回溯 性 至 关 重 要 。 考 虑 如 图 
2. 22 所 示 的 StateMate 模型 。 

在 第 2 阶段 ，a 与 4 的 新 值 都 是 首先 存储 在 临时 变量 中 ， 记 为 ， 与  。 在 最 
后 阶段 ， 临 时 变量 的 值 才 复制 到 了 用 户 定 义 的 变量 中 : 

阶段 2: a’ :=b; b’; =a; 
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阶段 3 : a; =a’; b; =z 

当 事 件 。 发生 时 ， 两 个 变量 的 值 将 发 生 交换 。 这 种 行为 类 似 于 连接 到 相同 时 钟 
源 〈 见 图 2.23) 的 两 个 交叉 耦合 寄存 器 〈 每 个 变量 各 一 个 ) ， 它 反映 了 这 两 个 寄 
存 器 9 的 同步 (从 时 钟 上 考虑 ) 有 限 状 态 机 操作 。 

















> lo 时 钟 源 
e/a:=b | e/b:=a 
图 2.22 依赖 性 的 赋值 图 2.23 ”交叉 耦合 的 D 型 寄存 器 


如 果 这 些 操作 的 各 个 阶段 不 是 分 开 的 ， 则 两 个 变量 可 能 会 被 赋予 相同 的 值 ， 这 
个 值 取决 于 赋值 操作 的 时 序 。 对 于 试图 反映 出 硬件 同步 操作 的 语言 ， 将 操作 分 成 两 
个 (至少) 阶段 是 很 典型 的 情况 。 在 VHDL 中 ， 这 种 划分 更 常见 。 基 于 这 种 划分 ， 
仿真 结果 将 不 会 依赖 于 模型 中 的 哪 部 分 先 被 执行 到 ， 这 种 特性 非常 重要 。 和 否则 ， 相 
同 的 仿真 可 能 会 产生 多 个 似乎 是 正确 的 结果 ， 这 在 设计 流程 中 常常 会 导致 混乱 。 对 
于 具有 确定 行为 的 实际 电路 仿真 ， 这 种 混乱 绝对 不 是 人 们 期 望 得 到 的 。 
对 于 这 种 特性 ， 有 多 种 命名 : 
1) Kahn [Kahn, 1974] 称 此 特性 为 有 序 性 。 
2) 在 其 他 一 些 论文 中 ， 此 特性 被 称 为 确定 性 。 这 个 术语 也 有 多 个 不 同 的 
D 此 术语 可 被 用 于 表示 非 确 定性 的 有 限 状 态 机 ， 它 们 在 同一 个 时 刻 可 能 会 存 
在 多 个 状态 [Hopcroft et al. ，2006 ] 。 

D 可 能 有 非 确定 性 操作 符 的 语言 ， 对 于 这 些 操作 符 ， 不 同 的 行为 也 会 被 执行 。 

O 对 于 系统 行为 依赖 于 某 些 不 明确 输入 的 系统 ， 一 些 作 者 常 称 它们 具有 非 确 
定性 。 

@ 在 此 处 Kahn 使 用 术语 “确定 性 (Determinate)”。 

在 本 书 中 ， 选 择 了 使 用 Kahn 的 方式 ， 从 而 减少 了 可 能 的 混淆 。 只 有 在 那些 
不 确定 的 行为 不 会 发 生 时 ，StateMate 模型 才 具 有 确定 性 。 如 在 某 些 情况 下 ， 转 换 
中 的 冲突 是 可 以 接受 的 ( 见 图 2. 24)。 

考虑 图 2.24a， 如 果 系 统 处 于 左 侧 的 状态 ， 发 生 了 事件 4， 需 要 明确 此 时 将 发 





”对 于 本 书 中 的 门 与 寄存 器 ， 采 用 的 是 IEEE 标准 的 电路 符号 (IEEE, 1991], K2. 23 展示 的 是 受 时 名 
驱动 的 D 型 寄存 器 。 
”在 本 书 第 1 版 中 ,使 用 了 术语 “确定 性 "， 同 时 补充 了 一 些 解 释 。 
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图 2.24 StateMate 转换 中 的 冲突 


生 什么 样 的 转换 。 如 果 使 用 随机 方式 来 解决 这 种 冲突 ， 则 系统 的 行为 就 是 非 确 定性 
的 。 通 常 ， 使 用 优先 级 机 制 可 以 避免 这 一 类 型 的 冲突 。 现 在 再 看 图 2. 24b， 在 * = 
15 时 仍然 会 产生 冲突 ， 这 样 的 冲突 有 时 候 很 难 被 觉察 到 。 为 了 实现 确定 的 行为 ， 
这 就 需要 完全 消除 系统 中 以 随机 方式 解决 的 冲突 。 

有 很 多 场景 需要 明确 的 描述 非 确 定性 的 行为 (如 从 两 个 输入 中 选择 其 中 之 
一 )。 在 这 类 场景 中 ， 确 实 描述 那些 在 运行 时 发 生 的 选择 (参见 2. 8. 2 节 关 于 ADA 
的 状态 选择 ) 。 

相对 于 分 层 架构 的 状态 ，y sE RS SR RS mak 





StateMate 更 能 准确 地 描述 确定 i 和 et eee ie 
的 行为 。 这 种 实现 与 基于 软件 me me ma 
RAEE RADNE, TERRE 图 2.25 StateMate 模型 在 执行 中 的 步骤 

现 中 ， 所 选择 的 方案 并 不 被 明 

确 描述 。 


2.4.2.3 节 一 开始 描述 的 3 个 阶段 需要 被 反复 的 执行 ， 每 一 次 执行 称 为 一 个 步 
RR (step, ILAI 2.25), 

假定 每 当 有 事件 发 生 或 者 变量 改变 时 ， 均 会 执行 一 个 新 的 步 又 。 这 些 变量 以 及 
所 产生 的 (当前 时 间 产 生 的 ) 事件 ， 在 StateMate 模型 中 被 称 为 状态 O。 在 执行 完 
第 3 个 阶段 后 ， 将 得 到 一 个 新 的 状态 。 对 步 又 的 解释 ， 使 人 们 能 更 准确 地 定义 事件 
的 语义 。 这 些 所 产生 的 事件 ， 都 可 以 来 自 内 部 或 是 外 部 。 对 于 当前 正在 执行 的 步 又 
来 说 ， 因 它 而 产生 的 后 续 事 件 对 它 是 不 完全 可 见 的 。 假 如 ， 在 某 个 时 钟 跳 变 时 在 使 
能 寄存 器 中 永久 性 地 置 位 某 个 bt， 它 又 对 下 一 次 时 钟 跳 变 的 计算 结果 产生 影响 ， 
它们 都 不 是 永久 性 的 事件 。 

与 之 相对 应 ， 变 量 保持 着 它们 的 值 ， 直 到 被 重新 赋值 。 根 据 StateMate 的 语法 ， 
新 的 变量 值 在 每 一 个 步骤 变化 中 ， 对 模型 的 其 他 部 分 都 是 完全 可 见 的 。 也 就 是 说 ， 
StateMate 语法 会 把 两 个 相 邻 的 步 又 间 的 变量 赋值 操作 告知 给 其 他 部 分 ， 它 明确 地 
使 用 广播 机 制 来 同步 变量 的 变化 。 这 意味 着 针对 基于 共享 内 存 的 平台 设计 ， 以 及 基 








O 更 多 地 使 用 了 术语 “状态 机 ”来 代替 “状态 ”， 事 实 上 ， 术 语 “状态 机 ”在 StateMate 中 有 不 同 的 
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于 消息 传递 的 分 布 式 系统 而 言 ， 状 态 图 或 StateMate 更 适用 于 前 者 。 这 种 语言 从 一 
开始 ， 即 使 没有 明确 的 指示 ， 它 也 假定 系统 是 基于 共享 内 存 通 信 。 对 于 分 布 式 系 
统 ， 在 两 个 步 又 之 间 更 新 所 有 的 变量 是 非常 困难 的 事情 。 由 于 使 用 这 种 广播 机 制 ， 
StateMate 并 不 适合 对 分 布 式 系统 进行 建 模 。 
2.4.2.4 评估 与 扩展 

以 控制 功能 为 主 的 局 部 系统 ， 是 状态 图 的 主要 应 用 领域 。 它 的 突出 优点 是 可 以 

意 进 行 层次 的 虑 套 ， 以 及 使 用 AND 和 OR 状态 机 ; 其 次 ，StateMate 语法 已 经 有 

非常 规范 的 定义 [Drusinsky and Harel，1989] ;第 三 ， 当 前 已 经 有 很 多 基于 状态 图 
的 商业 化 工具 ， 如 StateMate [IBM, 2010a] 与 StateFlow [ MathWorks, 2010], ix 
其 中 的 许多 工具 还 可 以 将 状态 图 转化 为 等 效 的 C 或 VHDL 语言 。VHDL 语言 在 经 过 
综合 后 ， 即 可 转化 为 硬件 。 因 此 ， 可 以 认为 基于 状态 图 的 工具 ， 已 经 提供 了 完整 的 
从 状态 图 规范 ， 直 至 硬件 产生 的 设计 流程 。 它 也 可 以 产生 可 编译 与 执行 的 C 程序 ， 
提供 了 基于 软件 意识 的 设计 方法 与 可 能 性 。 

不 笠 的 是 ， 这 种 自动 转换 的 效率 仍然 令 人 担忧 。 如 可 以 将 AND 状态 机 的 子 状 
态 映射 为 UNIX 的 进程 ， 这 在 低 端 处 理 器 上 必然 不 会 是 有 效 的 应 用 实现 。 试 图 在 状 
态 图 中 得 到 高 效 的 编程 实现 ， 这 是 不 太 可 能 的 ， 因 为 状态 图 不 是 基于 对 象 的 。 另 
外 ， 广 播 机 制 也 使 它 并 不 适合 分 布 式 系统 。 状 态 图 并 不 包含 可 描述 复杂 计算 的 结 
构 ， 它 也 很 难 描述 硬件 结构 与 非 功 能 性 的 行为 。 

状态 图 的 商业 实现 通常 都 提供 一 些 机 制 ， 从 而 消除 模型 中 的 一 些 限制 。 如 C 
语言 可 被 用 于 表达 一 些 程 序 结构 ， 而 StateMate 中 的 模块 图 (module charts ) 可 以 
用 于 表示 硬件 结构 。 

状态 图 提供 了 超时 机 制 ， 但 没有 指定 更 简明 的 方式 去 描述 其 他 关于 时 序 上 的 
需求 。 

UML 包含 了 状态 图 的 变种 ， 它 允许 对 状态 机 进行 建 模 。 在 UML 的 版 本 1.0 
中 ， 这 些 图 被 称 为 状态 图 ， 在 2.0 及 以 后 的 版 本 中 被 称 为 状态 机 图 。 在 UML 中 关 
于 状态 机 图 的 语义 与 StateMate 不 同 ， 即 它 不 再 包含 仿真 的 3 个 阶段 。 


2.4.3 同步 语言 


2.4.3.1 动机 

就 状态 机 图 而 言 ， 描 述 复杂 的 SUD 非常 困难 ， 它 不 能 用 于 表达 复杂 的 计算 。 
标准 的 编程 语言 可 以 表达 复杂 的 计算 ， 但 多 线程 的 执行 顺序 很 难 预测 。 在 可 抢占 式 
的 多 线程 运行 环境 中 ， 不 同 的 计算 之 间 可 能 存在 多 种 交叉 关系 。 理 解 并 发 系统 中 的 
所 有 可 能 行为 是 一 件 非 常 困难 的 事情 ， 其 关键 因素 之 一 就 是 多 线程 有 可 能 存在 多 种 
执行 顺序 ， 而 不 同 的 执行 顺序 可 能 产生 不 同 的 结果 。 非 确定 性 的 系统 行为 将 产生 多 
种 负面 效应 ， 如 对 一 些 设计 中 的 问题 进行 验证 。 如 果 分 布 式 系统 的 时 钟 不 可 靠 ， 则 
很 难得 到 确定 的 系统 行为 。 但 对 于 非 分 布 式 系 统 ， 可 以 避免 因 不 必要 的 非 确定 语义 
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引起 的 问题 。 

对 于 同步 语言 ， 有 限 状 态 机 与 编程 语言 被 归并 为 同一 模型 。 同 步 语言 可 以 用 于 
表达 复杂 的 计算 ,但 最 根本 的 执行 模型 还 是 有 限 自动 机 ， 它 们 描述 了 并 行 的 自动 操 
作 。 基 于 以 下 的 关键 特性 可 以 得 到 确定 的 行为 :“… 当 自动 机 的 构成 是 并 行 的 ， 自 
动机 的 “同时 ”转换 将 引起 系统 的 转换 ”[ Halbwachs，1998] 。 这 也 意味 着 ， 如 果 
自动 机 受 其 自己 的 时 钟 控制 ， 则 可 以 不 再 考虑 自动 机 状态 变化 的 不 同 顺序 。 可 以 假 
定 存 在 单一 的 全 局 时 钟 ， 每 个 时 钟 节拍 将 重新 检测 所 有 输入 ， 从 而 计算 出 新 的 输出 
与 状态 并 作出 转换 ， 这 就 需要 模型 间 各 个 模块 有 快速 的 广播 机 制 。 理 想 的 并 发 情况 
是 能 保证 系统 的 确定 行为 ， 这 也 是 相对 于 一 般 通信 有 限 状 态 机 (CFSM) 模型 的 限 
制 ， 因 为 在 CFSM 中 的 每 个 FSM 都 有 其 自己 的 时 钟 。 同 步 语言 也 体现 了 同步 硬件 
的 操作 理论 ， 以 及 如 IEC 60848 [IEC, 2002] 和 STEP 7 [Siemens, 2010] 一 类 的 
控制 语言 。 参 考 Potop- Butucaru 等 人 [ Potop- Butucaru et al. ，2006] 的 著作 可 以 更 
进一步 地 了 解 同步 语言 。 
2.4.3.2 典型 的 同步 语言 ， ESterel、Lustre 和 SCADE 

Esterel [ Esterel Technologies Inc. ，2010] 、[ Boussinot and de Simone, 1991] 和 
Lustre [ Halbwachs et al. , 1991 ] 已 经 将 保持 系统 的 确定 行为 作为 其 语言 的 重要 
特性 。 

Esterel 是 一 种 激励 语言 : 当 系统 因 输入 事件 的 发 生 而 处 于 活动 时 ，Esterel 模型 
将 产生 输出 事件 。Esterel 是 一 种 同步 语言 : 所 有 的 激励 输出 都 假定 在 零 时 间 内 完 
W, Esterel 有 能 力 分 析 系 统 在 离散 时 间 内 的 行为 。 理 想 化 的 模型 应 该 是 可 以 完全 消 
除 关 于 时 间 段 重 倒 ， 以 及 某 次 事件 在 上 一 次 事件 未 能 完成 之 前 到 来 而 引起 的 冲突 。 
与 其 他 一 些 并 行 语言 一 样 ，Esterel 也 有 并 行 的 操作 符 ， 记 作 “ | ”。 与 状态 图 相 
似 ， 它 也 使 用 基于 广播 机 制 的 通信 ， 但 它 的 通信 都 是 即时 的 ， 这 又 与 状态 图 不 一 
样 。 在 此 处 ， 它 的 意思 是 “在 相同 的 时 钟 周 期 内 ”。 这 意味 着 在 特定 的 某 个 时 间 段 
内 产生 的 信号 ， 在 模型 的 各 个 部 分 都 能 观察 到 它 ， 如 果 某 个 模块 对 此 信和 号 敏感 ， 也 
必须 在 相同 的 时 间 段 内 作出 反应 。 为 了 达到 稳定 的 状态 ， 也 许 需要 多 次 反复 。 关 于 
Esterel 的 更 多 更 新 信息 ， 可 以 参考 Esterel 的 主页 Esterel Technologies Inc. , 
2010], 

Esterel 与 Lustre 使 用 了 不 同 的 语法 去 描述 CFSM, Esterel 使 用 了 命令 式 的 语言 
方式 ， 而 Lustre 看 起 来 更 像 是 数据 流 语 言 (参考 2.5 节 关 于 数据 流 的 描述 ) Sync- 
Charts 就 是 Esterel 的 图 形 化 版 本 之 一 。 这 三 种 语言 都 是 基于 CFSM 进行 阐述 的 ， 它 
们 有 着 许多 相似 相关 性 。 商 业 化 的 SCADE [Esterel Technologies, 2010] 包含 了 这 
三 种 语言 的 特点 ， 它 主要 用 作 一 些 对 安全 性 有 苛刻 要 求 的 软件 模块 设计 ， 如 空中 客 
车 (Airbus ) 。 

”基于 StateMate 中 的 3 个 仿真 阶段 ，StateMate 有 着 同步 语言 的 关键 特性 ， 并 且 
如 果 消 除了 其 中 的 冲突 ， 则 它 也 是 确定 性 的 。 根 据 Halbwachs 的 描述 , “除了 不 具 
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备 即时 广播 的 特性 外 ，StateMate 是 很 完备 的 一 种 同步 语言 ”[ Halbwachs, 2008] 。 
2.4.4 SDL: 消息 传递 的 场景 


2.4.4.1 语言 特性 

状态 图 并 不 适合 对 分 布 式 的 通信 有 限 状态 机 建 模 。 对 于 分 布 式 系统 ， 消 息 传递 
是 更 好 的 通信 机 制 。 因 此 ， 将 展示 两 个 例子 : 其 中 之 一 是 基于 通信 有 限 状 态 机 ; 另 
一 个 是 基于 异步 消息 传递 。 

SDL (Specification and Description Language， 规 范 描 述 语 言 就 是 为 分 布 式 应 
用 而 设计 的 。 它 产生 于 20 世纪 70 年 代 ， 在 80 年 代 发 布 了 正式 的 语法 。SDL 是 一 
种 国际 电信 联盟 (International Telecommunication Union, ITU ) 指定 的 标准 语言 ， 
它 的 第 一 版 标准 Z. 100 在 1980 年 发 布 ， 而 后 在 1984 年 、1988 年 、1992 (SDL-92) 
年 、1996 年 与 1999 年 进行 了 更 新 ， 其 相关 的 标准 包括 SDL-88 SDL-92 与 SDL-2000 
[ SDL Forum Society, 2010], 





些 用 户 会 倾向 于 选择 图 形 化 的 
初始 状态 状态 

规范 语言 ， 但 另 一 些 人 却 更 愿意 选择 人 初始 = 
文本 化 的 语言 。SDL 则 提供 了 文本 化 [ < 输入 | > 输出 





与 图 形 化 两 种 兼容 方式 。 进 程 是 SDL M22 spr mies 
的 基本 组 成 要 素 ， 它 代表 了 扩展 的 有 
限 状态 机 的 模型 ， 这 种 扩展 也 包含 了 对 数据 的 操作 。 图 2. 26 展示 了 SDL 的 图 形 化 
表达 方式 中 的 图 形 符号 。 

在 本 例 中 ， 将 思考 如 何 使 用 SDL 对 图 2. 27 中 的 状态 图 进行 表达 。 除 了 增加 输 
出 ， 删 除了 状态 Z 及 修改 了 受 影响 的 信号 以 外 ,图 2.27 与 图 2. 15 是 一 模 一 


样 的 。 
fe 
i g/w h/x ©) i/y "O 
k 


图 2.27 SDL 描述 的 FSM 








图 2. 28 是 图 2. 27 相应 的 图 形 化 SDL 表达 。 

很 明显 ， 图 2. 28 中 的 表达 与 图 2. 27 中 的 状态 图 表达 是 等 价 的 。 

作为 FSM 的 扩展 ，SDL 的 进程 可 以 对 数据 进行 操作 。 在 SDL 的 进程 中 ， 可 以 
声明 局 部 的 变量 ,它们 可 以 预先 定义 ， 又 或 者 在 SDL 描述 时 定义 。SDL 还 支持 抽 
象 的 数据 类 型 (ADT) ， 在 SDL 中 声明 与 操作 的 语法 与 在 其 他 语言 中 很 相似 。 图 
2. 29 展示 了 如 何 声明 、 赋 值 与 判断 。 

SDL 还 包含 了 诸如 程序 一 类 的 编程 语言 要 素 ， 程 序 调用 也 可 以 以 图 形 化 的 方式 
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s 进程 P1 
= JO 
y 
g a h < i < 7 T % k < 
V V | V V 
w> = ð y > £ > b 
S. | a Į 
RS TEES ea ew 
图 2.28 图 2.27 的 SDL 表达 
DCL | | Counter := Counter + 3; | 
Counter Integer; 
Date String; an 
j V V 
(1:10) (11:30) ELSE 
y V ae | 











图 2.29 SDL 中 的 声明 、 赋 值 与 判断 


进行 表达 。 在 SDL-1992 中 ， 发 布 了 基于 对 象 的 编程 特性 ， 而 后 又 在 SDL-2000 中 
得 到 了 扩展 。 

扩展 的 FSM 仅仅 是 SDL 描述 符 中 的 基本 要 素 。 通 常 ，SDL 描述 符 还 要 包含 多 
个 接口 进程 ， 或 者 FSM。 进 程 可 以 向 其 他 进程 发 送 消息 。SDL 中 进程 间 通 信 的 语义 
是 基于 异步 消息 传递 的 ， 每 个 进程 都 有 一 个 与 之 相关 联 的 先进 先 出 (FIFO, First- In 
First-Out) 队列 。 发 送 到 一 个 特定 进程 的 消息 都 将 存储 到 相应 的 FIFO 队列 中 ( 见 
图 2.30) 。 











图 2.30 SDL 的 进程 间 通 信 


假定 每 个 进程 都 会 从 FIFO 队列 中 获取 可 用 的 下 一 条 消息 ， 同 时 检查 它 是 否 与 
当前 所 描述 的 输入 状态 相 匹配 。 如 果 匹 配 ， 则 产生 相应 的 状态 转换 以 及 输出 ; 如 果 
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KA FIFO 队列 中 的 消息 与 所 列举 的 输入 不 匹配 ， 此 消息 将 被 忽略 (除非 使 用 了 存 
储 机 制 )。 理 论 上 ， 假 定 FIFO 队列 的 长 度 是 无 限 的 ， 这 就 意味 着 对 于 SDL 模型 语 
义 的 描述 符 ， 可 以 不 必 考 虑 FIFO 的 溢出 问题 。 然 而 在 现实 系统 中 ， 无 限 长 度 的 队 
列 是 不 可 能 存在 的 ， 它 必须 有 一 定 的 长 度 。 这 就 是 SDL 的 问题 之 一 : 为 了 从 规范 
中 得 到 实现 ， 必 须 为 FIFO 队列 提前 规定 一 个 合适 的 长 度 上 限 。 

使 用 进程 间 通 信和 图 ， 可 以 更 好 地 观察 哪些 进程 之 间 存 在 通信 。 进 程 间 通信 图 包 
含 用 于 发 送 与 接收 消息 的 通道 。 在 SDL 的 场景 中 ， 术 语 “ 消 息 (signal)” 表 示 了 
模型 化 自动 机 的 输入 与 输出 。 

例如 ， 图 2. 31 展示 了 进程 间 通 信 图 BI ， 它 有 Swl 和 Sw2 两 个 通道 ， 括 号 内 包 
含 了 相应 通道 传输 的 消息 名 称 。 





模块 BI 











图 2.31 进程 间 通 信和 图 


有 3 种 方式 来 表示 消息 的 接收 : 

Counter Counter 

1) 通过 进程 标识 : 在 图 形 化 的 TOOFFSPRING -A VIA Sw1 > 
输出 符号 中 使 用 接收 进程 的 标识 PEE 
(ILEI 2.32 Æ)o 

并 不 需要 在 编译 阶段 就 固定 进程 的 数量 ， 因 为 进程 完全 可 以 在 运行 时 动态 创 
32, OFFSPRING 就 是 一 个 进程 动态 创建 的 子 进程 的 消息 标识 。 

2) 显 性 的 : 直接 标识 出 通道 的 名 称 ( 见 图 2. 32 右 ) Sw 就 是 通道 的 名 称 。 

3) RER: 当 消息 的 名 称 暗 含 着 通道 名 称 时 ， 消 息 将 使 用 这 些 通道 。 如 在 图 
2.31 中 ， 消 息 B 暗示 着 它 总 是 通过 通道 Swl 进行 通信 。 

在 进程 中 不 可 以 再 定义 新 的 进程 (进程 不 可 以 舰 套 ) ， 但 它们 可 以 按 层次 组 织 
起 来 ， 称 为 模块 (Blocks) ， 最 高 层 的 模块 即 系统 。 进 程 间 通信 图 是 模块 图 中 的 一 
个 典型 例子 。 进 程 间 通 信 是 分 层 描 述 符 中 基本 单元 层级 的 行为 ，B1 可 被 用 于 进程 
间 的 通信 模块 (如 在 图 2. 33 中 的 B)。 


模块 B 
C2 C4 
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图 2.33 SDL 模块 
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在 分 层 结构 的 最 高 层 便 是 系统 ( 见 图 2. 34) ， 如 果 外 部 环境 同样 被 模型 化 为 一 
个 模块 ， 则 系统 在 其 边界 上 不 会 有 任何 通道 与 之 相连 。 
图 2. 35 展示 了 基于 图 2.31、 图 2. 33 以 及 图 2. 34 的 分 层 模型 。 








系统 S 
































图 2.34 SDL 系统 图 2.35 SDL 分 层 结 构 


进程 间 通 信 图 与 分 层 描述 符 的 树叶 很 贴近 ， 系 统 描述 符 则 表示 了 它们 的 树 根 。 
在 SDL-2000 的 版 本 中 ， 消 除了 在 分 层 建 模 时 的 很 多 限制 。 使 用 SDL-2000， 模 块 与 
进程 的 描述 能 力 得 到 了 进一步 协调 ， 它 使 用 了 更 通用 的 代理 概念 (agent concept) 。 

为 了 支持 对 时 间 的 建 模 ，SDL 还 包含 定时 器 (timers)。 定 时 器 可 以 在 进程 内 
部 进行 定义 ， 可 以 分 别 使 用 SET 与 RESET 原 语 来 设置 与 复位 它们 。 

图 2. 36 展示 了 定时 器 了 T 的 使 用 。 
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图 2.36 使 用 定时 器 T 


图 2. 36 中 的 定时 器 与 图 2. 28 相似 ， 在 状态 从 刀 转 换 到 五 这 一 过 程 中 ， 定 时 器 被 
设 定 为 当前 时 间 加 上 p。 对 于 从 EE 至 4 的 转换 ， 使 用 了 p 个 时 间 单位 的 超时 定时 器 。 
如 果 在 消息 /被 接收 到 之 前 定时 器 超时 ， 则 状态 转 至 4， 但 不 产生 输入 信和 号 v。 

SDL 可 用 于 描述 计算 机 网 络 中 的 协议 栈 。 图 2. 37 展示 了 通过 一 个 路 由 器 连接 
的 3 个 处 理 器 ， 处 理 器 与 路 由 器 之 间 基 于 FIFO 进行 通信 。 

处 理 器 与 路 由 器 基于 分 层 协议 ( 见 图 2. 38)。 

每 一 层 都 在 更 加 抽象 的 层次 上 来 描述 通信 机 制 。 每 一 层 的 行为 通常 以 有 限 状 态 
机 来 进行 建 模 。 这 些 FSM 的 描述 细节 都 依赖 于 网 络 协议 ， 可 能 会 非常 复杂 。 通 常 ， 
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图 2.37 在 SDL 中 描述 的 小 型 计算 机 网 络 
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图 2.38 SDL 中 的 协议 栈 


这 些 行为 包含 校 验 与 处 理 错误 ， 整 理 与 分 发 信息 包 。 

SDL 工具 包括 UML 接口 、SC。 在 SDL 论坛 上 有 完整 的 工具 列表 [SDL Forum 
Society, 2009 ] 。 

Estelle [ Budkowski and Dembinski, 1987 | 是 另 一 种 设计 用 于 描述 通信 协议 的 
语言 。 与 SDL 相似 ，Estelle 也 假定 通信 是 通过 通道 与 FIFO 进行 的 ， 但 Estelle 与 
SDL 并 没有 统一 为 一 种 语言 。 
2.4.4.2 对 SDL 的 评估 

SDL 非常 适合 分 布 式 应 用 ， 它 也 得 到 了 广泛 的 应 用 ， 如 在 ISDN 的 设计 方面 。 

SDL 并 不 需要 具有 确定 性 〈 它 的 消息 并 不 需要 在 指定 的 时 间 发 送 到 FIFO 中 ) 。 

可 靠 的 实现 需要 知道 FIFO 的 深度 上 限 ， 但 有 时 候 可 能 很 困难 。 定 时 器 的 概念 
对 于 软 实时 要 求 就 已 经 足够 了 ， 但 对 于 硬 实时 要 求 还 远 远 不 够 。 

SDL 并 不 像 状 态 图 那样 提供 对 分 层 设计 的 支持 。 

在 SDL 中 没有 充分 的 编程 支持 (最 近 的 版 本 中 已 经 开始 支持 ) ， 对 非 功能 性 的 
属性 也 没有 对 应 的 描述 符 。 这 样 的 话 ， 即 使 是 它 在 作为 参考 模型 时 非常 有 用 ， 但 看 
起 来 SDL 并 没有 什么 吸引 人 的 地 方 。 


2.5 数据 流 


2.5.1 范围 
数据 流 是 对 现实 应 用 进行 描述 的 一 种 非常 “自然 的 ”方式 。 数 据 流 模型 反映 
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了 数据 如 何 从 一 个 模块 到 另 一 个 模块 的 过 程 [Edqwards，2001] 。 每 一 个 模块 都 对 数 
据 以 这 样 或 那样 的 方式 加 以 处 理 。 

下 面 是 对 数据 流 的 定义 [Wikipedia，2010 ] : 
和 定义: 数据 流 建 模 “是 标识 、 模 拟 与 规范 数据 如 何在 信息 系统 中 转换 的 过 程 。 数 
据 流 建 模 检查 过 程 〈 将 数据 从 一 种 形式 转换 为 另 一 种 形式 ) ， 数 据 存储 〈 保 存 数据 
的 区 域 ) ， 外 部 实例 〈 由 谁 来 发 送 数据 ， 由 谁 来 接收 数据 ) ， 数 据 流 (数据 流 经 的 
BRIE)” o 

数据 流程 序 使 用 的 是 直接 的 图 形 化 方式 ， 其 中 的 节点 也 被 称 为 执行 器 ， 表 示 了 
流程 中 的 计算 ， 圆 角 矩 形 表示 了 计算 的 数据 流向 。 数 据 流 中 计算 都 被 认为 是 功能 ， 
的 ， 即 它们 都 依赖 于 输入 的 值 。 数 据 流 图 形 中 的 每 个 进程 都 被 分 解 为 时 序 化 的 流 
程 ， 它 们 都 是 原子 操作 (Atomic Actions ) 。 

如 在 图 2. 39 中 描述 了 一 个 语音 控制 系统 的 数据 流程 [Ko and Koo, 1996], 


y 管理 控制 me = 
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图 2.39 语音 控制 系统 


对 于 无 约束 的 数据 流 ， 很 难 描述 系统 的 属性 。 因 此 ， 一 般 都 只 对 有 约束 的 模型 
进行 描述 。 
2.5.2 Kahn 处 理 网 络 


Kahn 处 理 网 络 (Kahn Process Networks, KPN) [ Kahn, 1974] 是 一 种 特定 的 
数据 流 模型 。 与 其 他 数据 流 模型 一 样 ，KPN 也 包含 着 节点 与 边 。 其 中 ， 节 点 对 应 
着 由 程序 或 任务 执行 的 计算 。KPN 流程 图 与 所 有 数据 流程 图 相似 ， 展 示 了 所 进行 
的 计算 以 及 它们 之 间 的 依赖 关系 ， 但 KPN 流程 图 并 不 能 展示 出 各 个 计算 之 间 必 须 
遵守 的 顺序 (这 一 点 与 汉 : 庶 依 曼 编程 语言 中 的 规范 相反 ， 如 C 语言 ) KPN 中 的 
边 展 示 了 通过 含有 有 限 FIFO 的 通道 进行 的 通信 。 计 算 时 间 与 通信 时 间 也 许 没 有 可 
比较 性 ， 但 总 是 需要 保证 通信 在 一 定 的 时 间 内 完成 。 由 于 已 经 假定 FIFO 的 大 小 总 
是 能 满足 需求 ， 因 此 通信 时 的 写 操作 都 是 非 阻塞 性 的 。 读 操作 总 是 从 单一 通道 进行 
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读 取 ， 在 尝试 读 取 之 前 ， 操 作 节 点 并 不 知道 数据 是 否 能 成 功 读 取 ， 而 进程 不 能 因为 
此 操作 而 阻塞 。 但 如 果 是 从 一 个 空 的 FIFO 队列 中 读 取 ， 则 会 被 阻塞 。 只 允许 单一 
进程 从 特定 的 队列 中 读 取 ， 同 时 也 只 允许 单一 进程 向 一 个 队列 中 写 。 因 此 ， 如 果 输 
出 数据 被 发 送 到 了 多 个 进程 ， 这 些 进 程 必须 对 数据 进行 复制 。 进程 间 的 通信 仅 有 通 
过 FIFO 队列 这 一 种 方式 。 
在 下 面 的 例子 中 ，p1 与 p2 分 别 从 对 方 接收 数据 ，p2 对 数据 进行 加 操作 ， 而 
pl 对 数据 进行 减 操作 : 
process p1(in int u, out int v){ 
int i; 
i= 0; 
for (;;) { 
send(i,v); -- send i via channel v 
i = wait(u); -- read i from channel u 
i=i-1; 
D 
process p2(in int v, out int u){ 
int i; 
for (;;) { 
i = wait(v); 
i=i+1; 
send(i,u); 
J} 
图 2. 40 是 KPN 对 上 例 的 图 形 化 表达 。 v 


很 显然 ， 由 于 消息 不 会 在 通道 中 累积 ， 因 FIFO 

此 在 此 例 中 并 不 需要 FIFO, Levi 仿真 软件 (oS © 

[ Sirocic and Marwedel, 2007b | 可 以 对 本 例 及 

其 他 一 些 例 子 进行 仿真 。 
约束 形成 了 KPN 的 关键 特性 : 节点 从 一 个 图 2.40 KPN 的 图 形 化 表达 

通道 读 取 数 据 的 顺序 是 由 读 操作 的 时 序 决 定 

的 ， 它 并 不 依赖 于 节点 向 通道 发 送 数据 的 顺序 。 也 就 是 说 ， 读 操作 的 顺序 与 节点 产 

生 数 据 的 速度 无 关 。 对 于 一 组 给 定 的 输入 数据 ，KPN 总 是 产生 相同 的 结果 。 这 种 

特性 非常 重要 ， 从 而 在 KPN 的 仿真 中 ， 其 结果 与 仿真 的 速度 无 关 ， 它 们 总 是 相同 

的 。 尤 其 是 对 于 某 些 节点 与 分 布 式 的 执行 ， 其 仿真 结果 并 不 依赖 于 使 用 的 硬件 加 速 

器 。 这 种 属性 被 称 为 “确定 性 ”， 接 下 来 也 将 使 用 此 种 方式 。SDL 在 FIFO 上 遇 到 

的 冲突 问题 在 KPN 中 并 不 存在 。 由 于 有 这 些 属 性 ，KPN 常 被 用 于 表达 设计 流程 中 
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的 内 部 环节 。 

有 时 ，KPN 也 包含 了 扩展 的 “归并 ”的 操作 (相应 于 ADA 的 选择 (Select ) 
状态 ) 。 此 操作 允许 从 一 系列 队列 中 同时 有 序 地 读 取 数据 ， 同 时 等 待 通道 产生 数 
据 。 这 些 操作 都 是 不 确定 性 的 行为 : 如 果 两 个 输入 同时 到 达 ， 其 处 理 顺 序 是 不 确定 
的 。 这 种 扩展 在 实践 中 有 时 很 有 用 ， 但 它 破坏 了 KPN 最 重要 的 属性 。 

总 之 ， 由 于 估计 进程 的 精确 行为 比较 困难 ，Kahn 进程 在 运行 时 都 需要 调度 机 
制 。 这 些 问题 来 源 于 在 通道 的 速度 与 节点 方面 并 没有 作出 假设 。 对 于 真实 的 KPN 
模型 ， 在 一 般 的 场景 中 很 难 确定 使 用 有 限 长 度 的 FIFO 是 否 能 满足 要 求 。 因 此 ， 在 
早期 设计 阶段 执行 时 间 并 不 确定 时 ， 这 种 模型 就 足够 进行 分 析 了 。 有 一 些 可 用 的 调 
度 算法 [Kienhuis et al. , 2000] 可 以 参考 。 对 于 KPN， 进 程 的 数量 是 固定 的 ， 它 
并 不 在 运行 中 改变 。 


2.5.3 同步 数据 流 


如 果 对 节点 与 通道 加 上 时 序 约束 ， 则 调度 将 明显 变 得 更 加 容易 ， 关 于 缓冲 区 大 
小 的 考虑 也 会 更 容易 判断 。 同 步 数 据 流 (Synchronous Data Flow, SDF) [ Lee and 
Messerschmitt, 1987] 就 是 这 样 的 一 种 模型 。 

SDF 有 多 种 图 形 化 的 符号 ， 图 2. 41 左 图 展示 了 同步 数据 流 的 例子 。 例 子 中 的 
图 形 是 直接 表示 图 ， 节 点 4、B 分 别 展示 了 * 与 + 操作 。 当 有 输入 时 ， 节 点 就 可 以 
开始 计算 。 如 果 任 意 两 个 节点 之 间 有 依赖 关系 ， 则 需要 使 用 边 来 连接 这 两 个 节点 。 





B 





图 2.41 同步 数据 流 的 图 形 化 表达 


对 于 每 个 执行 ， 节 点 中 的 计算 被 称 为 firing。 对 于 每 个 firing， 有 许多 符号 与 数 
据 表达 被 处 理 及 产生 。 在 同步 数据 流 中 ， 一 个 firing 中 产生 与 处 理 的 符号 都 是 常 
量 。 常 量 上 的 标签 表示 了 相应 的 符号 数 。 这 些 常 量 使 不 同 速 率 的 信号 处 理应 用 变 得 
更 加 容易 ， 这 些 应 用 中 的 一 些 信号 计算 速率 是 另 一 些 信号 计算 速率 的 整数 倍 。 如 在 
电视 机 中 ， 某 些 信 号 的 计算 是 100Hz， 而 某 些 信和 号 按 50Hz 进行 计算 。 通 常 ， 发 送 
到 边 上 的 符号 数 与 被 处 理 的 符号 数 是 一 样 的 。 假 定 n, 是 单个 firing 中 一 些 发 送 者 所 
产生 的 符号 ,人 是 相应 的 处 理 频 率 ; n, 是 单个 firing 中 的 一 些 接收 者 所 处 理 的 符号 ， 
是 相应 的 处 理 频率 ， 于 是 就 有 











n *f =n, *f (2.1) 
这 种 情况 在 图 2. 42 中 以 另外 一 种 方式 进行 了 展示 。 如 果 n, 关 nn,， 则 需要 缓冲 
PRIE, HEEF Kahn 处 理 网 络 ，FIFO 的 大 小 可 以 被 比较 容易 地 计算 出 来 。 
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术语 同步 数据 流 表示 符号 UU J 
的 输入 与 符号 的 处 理 是 按 同步 | A P | 
方式 进行 的 (在 所 有 时 间 
点 ) 。 而 术语 异步 消息 传递 则 图 2 42 不 同 处 理 速率 的 SDF 模型 
意味 着 符号 可 以 被 缓存 到 
FIFO 中 。 基 于 处 理 与 产生 固定 数量 符号 这 一 物性 ， 可 以 较 容 易 地 在 编译 阶段 就 确 
定 执行 时 序 以 及 对 内 存 的 需求 。 因 此 ， 应 该 尽量 避免 在 运行 时 有 复杂 的 调度 。SDF 
图 可 以 表示 出 处 理 中 的 延 时 ， 这 可 以 用 带 连 线 的 符号 D 来 表示 ( 见 图 2.41 AB). 
SDF 图 也 可 以 被 转换 成 单 任务 或 多 任务 系统 中 周期 性 的 调度 (参见 [Pino and Lee, 
1995 ] )。 图 2. 41 中 展示 了 一 个 简单 的 合理 调度 的 例子 ， 它 包含 了 两 个 事件 序列 4、 
B (永久 循环 的 ) 。 事 件 序列 4 (A, A, B) (A 的 执行 次 数 是 B 的 两 倍 ) 并 不 合 
理 ， 因 为 这 将 导致 4 与 8 之 间 的 FIFO 缓冲 区 总 是 会 累积 出 无 限 的 符号 。 

SDF 在 有 些 场景 非常 有 意义 ,例如 在 多 媒体 系统 中 。 
在 这 种 情况 下， 每 个 符号 都 相应 地 包含 了 一 些 音频 或 视 
频 信 息 ， 如 一 个 音频 帧 或 视频 帧 。 在 处 理 端 ， 如 果 使 用 
前 面 提 到 的 非 汉 . 诺 依 曼 语言 对 其 进行 建 模 ， 则 会 遇 到 
很 多 问题 ， 而 如 果 使 用 SDF ( 见 图 2.43) 则 可 以 轻松 解 
决 ， 这 里 也 不 会 存在 死 锁 问题 。 但 是 ，SDF 并 不 允许 在 运 图 2.43 SDF 观察 者 模式 
行 过 程 中 添加 新 的 处 理 端 。 

SDF 是 一 种 确定 性 的 模型 ， 它 并 不 适合 对 控制 流程 进行 建 模 ， 如 有 多 个 分 支 的 
系统 等 。 不 过 ， 最 近 也 有 了 许多 经 扩展 与 变异 的 SDF， 倾 向 于 这 些 领 域 的 应 用 (如 
参考 Stuijk [Stuijk, 2007]): 

1) 举例 来 说 ， 可 以 依据 一 个 相关 的 有 限 状 态 机 的 模式 进行 建 模 。 对 于 每 一 种 
模式 ， 使 用 不 同 的 SDF 图 会 非常 有 用 ， 许 多 事件 将 导致 这 些 模式 之 间 的 转换 。 

2) 同类 同步 数据 流 (Homogeneous SDF, HSDF) 图 是 SDF 图 的 一 种 典型 场 
景 。 对 于 HSDF 图 ， 在 每 个 firing 产生 与 处 理 的 符号 总 是 1。 

3) 对 于 静态 循环 数据 流 (Cyclo- Static Data Flow，CSDF) ， 每 个 firing 产生 与 
处 理 的 符号 可 以 是 变化 的 ， 但 必须 是 周期 性 的 。 

包含 控制 流 的 复杂 SUD 在 建 模 时 必须 使 用 更 通用 的 计算 图 结构 。 


2.5.4 Simulink 


计算 图 结构 通常 用 于 控制 工程 中 。 在 这 个 领域 中 ，MATLAB 的 Simulink (jj 
A) 工具 箱 [The MathWorks Inc. ，2010] 、 [ Tewari, 2001] 使 用 得 非常 广泛 。 
MATLAB 是 基于 数学 模型 的 建 模 与 仿真 工具 ， 如 偏 微分 方程 等 。 图 2. 44 展示 了 
Simulink 模型 的 一 个 例子 [Marian and Ma, 2007], 

图 2. 44 右 侧 的 运算 放大 器 与 饱和 器 展示 了 模拟 信号 的 处 理 模 型 。 在 许多 场景 
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OR teta10 
teta_in -—————_F 
teta10 O stick_cmd 
pitch_mode “六 一 一 
elevator 
OR teta0 stick_com control 

































































tetad not_teta 
OS sticks 
teta_com_select goto - 
sticks 
elev_com a 
(@)} > ve_cmd 
Gain6 Saturation 
speed_com Speed_com 
OS Vc_sens —> teta_com 
Ve_sens 0 
œ ineg_rst 
[A] pitch_net 
air_speed_net 


A 2.44 Simulink 模型 


中 ,“ 电 路 ” 均 包含 一 些 模拟 元 件 符号 ， 如 积分 器 、 差 分 器 等 。 图 中 间 的 开关 说 明 
Simulink 同样 也 可 以 对 某 些 控制 流 进行 建 模 。 

这 种 图 形 是 一 种 比较 直观 的 表达 方式 ， 它 允许 控制 工程 更 专注 于 控制 功能 ， 而 
不 需要 考虑 为 实现 这 些 功能 所 需 的 代码 。 对 于 设计 中 涉及 的 模拟 电路 ， 仍 然 建议 使 
用 传统 的 电路 符号 来 表达 。 图 形 化 的 重要 目标 之 一 ， 即 为 了 从 这 些 模型 中 综合 出 软 
件 ， 它 常 与 术语 模型 化 设计 相关 ， 但 这 个 术语 并 没有 精确 的 定义 。 

Simulink 模型 的 语法 反映 的 是 对 数字 计算 机 系统 的 仿真 ， 它 也 能 反映 出 类 似 的 
模拟 电路 的 行为 ， 但 有 可 能 与 模拟 电路 的 真实 情况 不 太一 致 。 那 么 ，Simulink 模型 
的 语法 应 该 如 何 定义 呢 ? Marian 与 Ma [Marian and Ma, 2007] 对 其 语法 有 如 下 定 
义 :“ 对 于 模块 〈 节 点 ) 的 执行 与 通信 过 程 ，Simulink 使 用 了 一 种 理想 化 的 时 序 模 
型 。 在 仿真 时 间 中 ， 节 点 的 执行 与 通信 都 是 非常 迅速 的 过 程 ; 其 次 ， 仿 真 中 的 时 间 
按 精 确 的 步 长 增长 ” 。 也 就 是 说 ， 模 型 总 是 按时 间 一 步 一 步 执行 。 在 每 一 步 的 执行 
中 ， 对 节点 进行 运算 处 理 (在 该 步 的 零 时 间 点 ) ， 而 后 将 新 的 值 送 到 与 之 相连 接 的 
其 他 输入 端 。 这 种 解释 中 并 没有 指出 时 间 步 长 的 具体 值 ， 由 于 即使 是 缓慢 变化 的 输 
出 也 有 可 能 被 频繁 地 重新 计算 ， 它 也 没有 立即 指出 如 何 将 系统 进行 软件 实现 。 

Simulink 非常 适合 对 诸如 汽车 、 火 车 之 类 的 实际 系统 进行 高 层 建 模 ， 同 时 对 这 
些 系统 的 行为 进行 仿真 。MATLAB 与 Simulink 也 能 很 方便 地 对 数字 信和 号 处 理 系统 进 
行 建 模 。 为 了 产生 具体 的 实现 方案 ，MATLAB/Simulink 模型 都 必须 首先 被 转换 为 
一 种 硬件 或 软件 设计 系统 支持 的 语言 ， 如 C a VHDL, 

Simulink 模型 中 的 组 件 提供 了 执行 器 (Actors) 的 特殊 场景 。 可 以 认为 执行 器 
一 直 在 等 待 输 入 ,一 旦 它 需 要 的 输入 事件 产生 ， 则 立即 执行 与 它们 相应 的 操作 。 
SDF 是 基于 执行 器 语言 的 另 一 种 场景 ， 在 这 种 语言 中 ， 并 不 需要 像 在 非 冯 . ERE 
语言 中 那样 将 控制 传递 给 其 他 执行 器 。 
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2.6 Petri 网 


2.6.1 简介 


Petri 网 是 一 种 计算 过 程 图 模型 ， 它 可 以 对 控制 流程 进行 非常 充分 的 描述 。 事 
PFE, Peri 网 模型 仅仅 控制 着 流程 之 间 的 依赖 关系 ， 它 也 需要 模型 中 的 数据 来 进 
行 扩展 ， 它 更 强调 因果 依赖 。 

在 1962 年 ，Carl Adam Petri 发 布 了 他 关于 对 因果 依赖 进行 建 模 的 方法 ， 也 就 
是 后 续 的 Petri 网 [Petri ，1962 ] Petri 网 不 假定 系统 之 间 存 在 着 全 局 同步 ， 因 此 它 
特别 适合 于 描述 分 布 式 系统 。 

条 件 (Conditions), #4 (Events) 与 流 关系 (Flow Relation) 是 Petri 网 的 主 
要 元 素 : 条 件 可 能 被 满足 或 不 被 满足 ， 事 件 可 能 发 生 ， 流 关系 描述 了 事件 发 生 必 须 
要 满足 的 前 提 条 件 ， 它 也 描述 了 事件 发 生 后 会 变 成 真 的 条 件 。 在 Peri 网 中 的 图 形 
表示 中 ,通常 使 用 圆 形 来 表示 条 件 ， 方 框 来 表示 事件 ， 边 来 表 流 关系 。 图 2. 45 展 
示 了 Petri 网 的 一 个 例子 。 

















图 2. 45 展示 了 单轨 道 铁路 段 控 从 左 侧 进入 轨道 的 列车 从 右 侧 离开 轨道 的 列车 
制 不 同 来 车 方向 的 互 斥 操作 ， 它 使 。 SAM | 正在 去 信介 | 
用 了 令 牌 来 避免 相反 方向 来 车 的 冲天 =(@) =O) >( 
突 问题 。 在 上 面 的 Peri HH, S 
表示 为 模型 中 间 的 一 个 条 件 符号 ， 
它 以 部 分 填充 的 圆 〔 圆 的 中 间 还 包 “一 Or=< 本 上 -Or- 


全 ARE 去 往 左 侧 的 列车 
含 着 男 一 个 实心 的 圆 ) 来 表示 必需 


条 件 〈 即 轨道 可 用 )。 同 时 ， 列 车 一 一 单 通道 。 一 一 
准备 从 左 向 右 行驶 这 一 条 件 (在 图 图 2.45 ”单轨 道 铁路 段 


2.45 中 也 使 用 一 个 部 分 填充 的 圆 来 

表示 ) ， 对 于 “来 自 左 侧 的 列车 进入 轨道 ”的 事件 ， 这 两 个 条 件 都 必须 满足 ， 称 这 

两 个 条 件 为 前 置 条 件 (Preconditions) 。 只 有 事件 的 前 置 条 件 已 经 满足 ， 事件 才 可 

能 发 生 。 在 事件 发 生 后 ， 令 牌 将 立 从 左 侧 进入 轨道 的 列车 从 右 侧 离开 轨道 的 列车 

即 失 效 ， 即 没有 列车 等 待 着 进入 轨 

道 。 因 此 前 置 条 件 就 不 再 被 满足 ， 

也 就 没有 了 表示 为 必须 条 件 的 部 分 
《7 





©)—> 





填充 的 圆 ( 见 图 2. 46). 





但 是 ， 现 在 有 列车 从 左 向 右 行 (六 
怠 ， 因此 相应 的 条 件 又 被 满足 了 去 往 左 侧 的 列车 
( 见 图 2.46)。 在 事件 发 生 之 后 被 满 图 2.46 使 用 “轨道 ”资源 
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足 的 条 件 ， 被 称 为 后 置 条 件 (Postcondition) 。 通 常 ， 如 果 一 个 事件 的 所 有 前 置 条 
件 都 为 真 〈 或 满足 ) 了 ， 则 事件 就 可 以 发 生 。 如 果 事 件 发 生 ， 则 前 置 条 件 将 不 再 
被 满足 ， 而 后 置 条 件 生效 。 边 上 的 箭头 标识 了 一 个 事件 的 前 置 条 件 与 后 置 条 件 。 仍 
然 基于 这 个 例子 可 以 知道 ， 当 列车 离开 轨道 时 ， 它 将 把 令 牌 归还 给 模型 中 间 的 条 件 
( 见 图 2.47)。 


从 左 侧 进入 轨道 的 列车 从 右 侧 离开 轨道 的 列车 


等 待 开 往 右 侧 ! 正在 去 往 右 侧 | 
的 列车 y 的 列车 y 









































HO 


去 往 左 侧 的 列车 
图 2.47 释放 “轨道 ”资源 


tos 





如 果 两 辆 列车 竞争 单 向 轨道 路 段 的 使 用 权 〈 见 图 2.48) ， 则 它们 中 只 有 其 一 能 
进入 轨道 。 

在 这 种 场景 中 ， 下 一 个 被 激发 MENEAME WEMA 
的 状态 是 非 确定 性 的 。 在 进行 网 络 。 SARA) EERREN 1- 
分 析 时 ， 必 须 充分 考虑 可 能 发 生 的 三 > 他 ) 
情况 。 对 于 Petri 网 ， 更 乐意 于 使 用 
它 对 非 确 定性 系统 进行 建 模 。 

Petri 网 的 重要 优点 之 一 ， 就 是 
它 可 以 用 于 证 明 系 统 的 属性 ， 它 是 
产生 这 些 证 明 的 一 种 标准 化 方式 。 图 2.48 “轨道 ”资源 的 冲突 
为 了 证 明 这 一 点 ， 需 要 对 Petri 网 进 
行 更 正式 的 定义 。 考 虑 三 类 Petri 网 : 条 件 / 事 件 网 (Condition/Event Nets) 、 库 所 / 
变迁 网 (Place/Transitions Nets) 以 及 预测 网 (Predicate Transition Nets) 。 


2.6.2 条 件 / 事 件 网 


首先 对 Petri 网 中 的 条 件 / 事 件 网 进行 更 正式 的 定义 。 
定义 : N=(C, E, F) 被 称 为 一 个 网 ， 满 足以 下 条 件 ; 
1) RA CME AAA; 
2) FO(EXC)U(CXE) 是 二 元 关系 ， 也 称 作 流 关系 。 
集合 C 被 称 为 条 件 ， 而 集合 被 称 为 事件 。 
定义 : 设 定 入 是 一 个 网 ， 同 时 x*e (CUE), 那么 有 
1) “x:={y|yFx, ye (CUE)| 为 x 的 前 集 (Pre-Set), 如果 表示 一 个 事 





























去 往 左 侧 的 列车 
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件 ， 则 "x 也 称 为 x 的 前 置 条 件 (Preconditions) 集合 ; 

2) «*:=lylaFy, ye (CUE)} 称 为 x 的 后 集 (Post-Set)， 如 果 x 表示 一 个 
事件 ， 则 “x 也 称 为 x 的 后 置 条 件 (Postconditions) 集合 。 

如 果 这 些 集合 表达 的 事件 eC， 即 ， 如 果 x e， 则 更 倾向 于 使 用 术语 前 置 条 件 
与 后 置 条 件 。 
定义 : WE (c，e) ECXKE 

1) 如 果 cFeAeFc, W) (c, e) 被 称 作 一 个 循环 (Loop) ; 

2) 如 果 正 不 包含 任何 循环 ， 则 被 称 为 纯 网 (Pure Net) (ILEI 2.49 AR). 
定义 : 如 果 转 换 4 与 的 前 置 与 后 置 条 件 不 一 样 ， 则 4 被 称 为 简单 网 ( 见 图 2. 49 
中 间 图 与 右 图 )。 


pcs. ee ee 


图 2.49 非 纯 网 ( 左 图 ) 与 非 简单 网 (中 间 图 与 右 图 ) 























含有 不 满足 某 些 附 加 约束 的 非 隔离 元 素 的 网 ， 被 称 为 条 件 /事件 网 (图 中 的 节 
点 是 两 个 不 相关 的 集合 ) 。 鉴 于 接 下 来 更 多 的 讨论 是 关于 Petri 网 的 通用 类 ， 因 此 此 
处 不 过 多 讨论 这 些 附加 约束 。 


2.6.3 库 所 /变迁 网 


对 于 条 件 / 事 件 网 ， 每 一 个 条 件 只 有 一 个 令 牌 。 但 对 于 许多 应 用 ， 它 们 的 每 个 
条 件 都 可 能 有 多 个 令 牌 。 网 络 中 允许 一 个 条 件 有 多 个 令 牌 的 情况 ， 被 称 为 库 所 / 变 
迁 网 。 事 实 上 ， 库 所 是 与 当前 讨论 的 条 件 相 对 应 的 ， 而 变迁 与 事件 相对 应 。 每 个 库 
所 的 令 牌 数 被 称 为 一 个 标识 (marking) 。 从 数学 上 讲 ， 按 定义 允许 有 些 库 所 的 容 
量 为 w， 标 识 可 以 为 每 个 库 所 指定 有 限 多 个 资源 。 

假定 No 表达 的 是 含 0 的 自然 数 ， 可 以 将 库 所 /变迁 网 更 正式 地 定义 如 下 : 
和 定义: (P, T, F, K, W, M) 被 称 为 一 个 库 所 /变迁 网 

1) N=(P, T, F) 是 库 所 p eP MM, 变迁 te7， 流 关系 为 F，; 

2) 映射 : K: P 一 (WNWoU 1w| )\10| 表示 了 库 所 的 容量 (w 表示 无 限 的 容量 ) ; 

3) 映射 : W: fF 一 (Wo \ 101) 表示 了 边 的 权重 ; 

4) BUT: Mj: P>NU |w| 表示 了 边 的 初始 标识 。 

边 的 权重 会 影响 变迁 发 生 所 需要 的 标识 数量 ， 同 时 它 也 指出 了 当 变迁 发 生 时 产 
生 的 标识 数量 。 假 定 M(p) 表示 了 库 所 p eP 的 当前 标识 ，M'(p) 表示 的 是 变迁 
te 7 发 生 后 的 标识 。 属 于 前 置 条 件 的 边 的 权重 表示 了 从 前 集 的 库 所 中 移 除 的 令 牌 
数 。 相 应 地 ， 属 于 后 置 条 件 的 边 的 权重 表示 了 在 后 集 的 库 所 中 添加 的 令 牌 数 。 标 识 
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M'(p) 通常 按 如 下 进行 计算 : 


M(p) -W(p,t), WR pe'i’ 
M'(p) = M(p)+W(t,p), WR pet’ \"t 

M(p)-W(p,t)+W(t,p), 如 果 pe int’ 

M(p) 其 他 条 件 


图 2. 50 展示 了 变迁 t 如 何 影响 当前 标识 的 例子 。 





图 2.50 新 标识 的 产生 


默认 情况 下 ， 没 有 标签 的 圆 环 其 权重 为 1， 没 有 标签 的 库 所 的 容量 w 是 无 限 的 。 
现在 来 解释 变迁 ;+e 7 必须 满足 的 两 个 条 件 : 
1) 对 前 集中 的 所 有 库 所 p， 令 牌 的 数据 至 少 要 与 从 圆 环 p 到 + 的 权重 相等 ; 
2) 对 后 集中 的 所 有 库 所 p， 其 容量 必须 要 能 够 容纳 i 产生 的 新 令 牌 。 
满足 以 上 两 个 条 件 的 变迁 被 称 为 M- activated ， 它 的 定义 如 下 : 
定义 : 变迁 te 7 被 认为 是 M- activated & 
(Vpe “t:M(p)>W(p,t)) AC Vp’ et:M(p') + W(t,p’) <K(p’) ) 
这 些 激活 的 变迁 都 可 以 发 生 ， 但 并 不 是 必须 的 。 当 多 个 变迁 处 于 激活 态 时 ， 它 


们 发 生 的 时 序 是 非 确定 性 的 。 
自 激 变迁 i; 影响 的 令 牌 数量 ， 可 以 以 一 个 与 1 相关 的 向 量 表 达 式 来 定义 如 下 : 
-W(p,t), 如 果 pe “t\t" 
taie +W(t,p), We pet Vt 
-W(p,t) +W(t,p), 如 果 pe tne” 
0 其 他 条 件 


产生 于 自 激 变迁 t 的 新 令 牌 数 M'， 对 所 有 库 所 p 都 可 以 按 如 下 计算 : 
M'(p) =M(p) +t(p) 
使 用 “+ ”来 表示 向 量 的 加 法 ， 则 可 以 将 上 面 的 公式 重 写 为 
M'=M+t 
所 有 向 量 的 集合 :来 自 于 关联 矩阵 N， 向 量 t 是 N 的 列 向 量 : 
N:PxT>Z; WteT:N(p,t) =t(p) 

使 用 矩阵 N 可 以 更 正式 地 描述 系统 的 属性 。 如 对 于 自 激 变 迁 不 会 改变 令 牌 数量 
总 和 的 库 所 [ Reisig，1985 ] ， 可 以 计算 它 的 集合 ， 这 种 集合 被 称 为 恒定 库 所 
(Place Invariants) 。 为 了 寻找 恒定 库 所 ， 假定 ti HERET, t RÆ, FRE 
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所 中 的 集合 REP， 它 们 的 令 牌 数 将 不 会 发 生变 化 。 对 于 这 些 集合 ， 它 们 必须 满足 
2, ti(p) =0 (2.2) 
图 2. 51 展示 了 当 变 迁 发 生 时 ， 它 的 令 牌 总 数 不 会 发 生变 化 的 情况 。 
现在 介绍 库 所 集合 R 中 的 向 量 cx 的 属性 : ER 
tet 如 果 p eR ; 
= < 如 果 p&gR 
基于 这 个 定义 ， 重 写 式 (2.2) WF: ai 


a t(p) = È (p) * era(p)= tca=0 (2.3) 
式 中 G 一 一 数 积 。 
现在 来 查找 任何 变迁 的 自 激 均 不 会 改变 令 牌 总 数 的 库 所 的 集合 。 这 意味 着 对 于 
所 有 的 变迁 i 均 需 满足 下 式 : 


ti * cr=0 
E i (2.4) 
t, * CR =0 
使 用 关联 矩阵 的 道 ， 式 (2.4) 可 以 整合 成 下 式 : 
N" cp =0 (2.5) 


A (2.5) 表达 的 是 一 个 线性 齐 次 方程 。 和 矩阵 N 表 示 的 是 Petri 网 中 节点 的 权 
E. A (2.5) 中 的 系统 的 解 向 量 必然 是 一 个 特征 向 量 ， 其 中 的 元 素 必然 为 1 或 0 
(如 果 使 用 令 牌 总 和 的 权重 ， 则 也 可 以 使 (40) 阿姆斯特丹 科 

A 





用 整数 权重 值 ) 。 相 对 于 实数 解 向 量 的 线 z 
性 方程 ， 这 种 情况 更 加 复杂 。 然 而 , Mt E LRE 
(2.5) 中 也 可 以 得 到 其 他 信息 。 使 用 这 种 
证 明 方 法 可 以 展开 论证 ， 例 如 对 共享 资源 
如 何 做 到 了 正确 的 互 斥 访问 等 问题 。 

来 看 一 个 规模 更 大 些 的 例子 ， 仍 然 考 
虑 列车 同步 问题 。 尝 试 对 运行 在 阿 姆 斯 特 。 多时 
丹 、 科 隆 、 布 鲁 塞 尔 与 巴黎 之 间 的 高 速 PQ 
Thalys 列车 进行 建 模 。 在 从 阿姆斯特丹 与 one 
科隆 到 布鲁塞尔 的 部 分 路 段 ， 列 车 不 会 有 r 
任何 冲突 ， 因 此 这 些 路 段 直接 相连 而 后 到 
巴黎 。 在 从 巴黎 返回 的 途中 ,它们 在 布 鲁 © ， 
塞 尔 断 开 了 连接 。 假 定 Thalys 列车 必须 在 Oa se 


巴黎 与 其 他 列车 同步 ， 其 相应 的 Petri pin E252 运行 在 阿姆斯特丹 、 科 隆 、 
图 2. 52 所 示 布鲁塞尔 与 巴黎 之 间 的 Thalys 列车 模型 
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库 所 3 与 10 分 别 是 列车 在 科隆 与 阿姆斯特丹 等 待 的 模型 。 变 迁 2 与 9 是 列车 
从 科隆 与 阿姆斯特丹 开 往 布鲁塞尔 的 模型 。 在 列车 到 达 布鲁塞尔 后 ， 库 所 2 与 9 将 
执 有 令 牌 。 变 迁 1 连接 了 两 辆 列车 。 茶 杯 状 的 符号 表示 某 列 列车 的 司机 ， 他 将 在 布 
鲁 塞 尔 休 息 ， 而 其 他 司机 仍 将 开 往 巴黎 。 
变迁 5 是 巴黎 Nord 车 站 的 列车 同步 情况 模型 ， 也 有 一 些 将 Nord 车 站 与 其 他 车 
站 (例子 中 使 用 Nord 车 站 ， 事 实 上 它 也 许 是 巴黎 一 个 非常 复杂 的 车 站 ) 相连 的 列 
车 。 当 然 ，Thalys 列车 不 会 使 用 燕 汽 发 动机 ， 它 只 是 比 现代 的 高 速 列车 更 易于 比 
喻 。 图 2. 53 展示 了 此 例 中 的 矩阵 YT。 


P] Py Pa Py Ps Po Py Ps Po Pio Py Ph Pis 














h I -1 
tz ] -] 


to ] -] 
tio 1 -1 -] 
































图 2.53 Thalys 列车 例子 中 的 NM 


例如 ， 第 2 行 表示 激励 t 会 将 令 牌 p, 的 数量 加 1， 也 表示 它 会 将 令 牌 p; 减 1。. 
使 用 线性 代数 分 析 方 法 ， 可 以 得 到 这 个 系统 线性 公式 的 向 量 解 为 
cai =(1, 1, 1, 1, 1, 1, 0, 0; 0, 0, 0, 0, 0) 
csa = (1, 0, 0, 0, 1, 1; 0, 0, 1, 1, 1, 0,0) 
cra =(0, 0, 0,0, 0,0,0,0, 1,1,0,0, 1) 
cra = (0, 0, 0, 0, 0, 0, 1, 1,0,0,0, 1, 0) 
以 上 向 量 分 别 表 示 了 从 科隆 、 阿 姆 斯 特 丹 驶 出 的 列车 ， 从 阿姆斯特丹 驶 出 的 列 
车 的 司机 ， 以 及 经 过 巴黎 的 列车 。 可 以 看 到 ， 此 轨道 上 经 过 的 列车 与 司机 数量 是 固 
定 的 (这 也 正 是 人 们 期 望 的 ) 。 这 个 例子 展示 的 恒定 库 所 ， 它 们 可 以 以 标准 规范 来 
提供 系统 属性 。 


2.6.4 预测 /变迁 网 


当 实 例 规模 比较 庞大 时 ， 条 件 / 事 件 网 与 库 所 /变迁 网 的 规模 也 会 变 得 非常 庞 
大 。 减 小 网 络 大 小 的 常用 可 行 方法 ， 是 使 用 预测 /变迁 网 。 将 使 用 “哲学 家 就 餐 问 
题 ” 来 证 明 这 一 点 。 这 个 问题 假设 有 多 个 哲学 家 围绕 一 个 圆 形 的 餐桌 就 餐 ， 在 每 
个 哲学 家 的 前 面 都 有 一 盘 意 大 利 面 ( 见 图 2.54) 。 

在 每 个 哲学 家 前 面 的 盘子 里 只 有 一 把 又 子 ， 哲 学 家 要 么 吃饭 ， 要 么 思考 。 每 个 
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哲学 家 都 需要 与 他 相 邻 两 人 中 某 一 人 的 又 子 。 因 此 , 只 Q 个 

有 当 某 位 哲学 家 他 的 邻 座 之 一 不 吃饭 时 ， 他 才能 吃饭 。 CHS 
这 个 场景 可 以 模型 化 为 一 个 条 件 /事件 网 ， 如 图 2 

2.55 Ro RIF 对 应 于 思考 状态 ， 而 条 件 6 对 应 着 就 © 

餐 状 态 ， 条件 表示 有 可 用 的 叉子 。 可 以 看 出 ， 仅 仅 是 m 


这 样 一 个 小 问题 ， 网 络 的 规模 已 经 变 得 比较 大 了 。 而 使 ”图 2.54 哲学 家 就 餐 问 题 


用 预测 /变迁 网 ， 就 可 以 减 小 网 络 的 大 小 。 图 2. 56 所 示 是 对 相同 问题 使 用 预测 / 变 
迁 网 进行 的 建 模 。 



















































































图 2.55 哲学 家 就 餐 问题 的 库 所 / 图 2.56 哲学 家 就 餐 问 题 的 预测 / 
变迁 网 模型 变迁 网 模型 


在 预测 /变迁 网 中 ， 每 个 令 牌 都 有 不 同 的 标识 区 别 于 其 他 的 令 牌 S。 在 图 2. 56 

中 ， 就 使 用 了 这 种 方式 来 区 分 哲学 家 p, ~p, 以 及 叉子 有。 因此 ， 可 以 使 用 变量 与 函 

数 对 模块 进行 标识 。 在 此 例 中 ,我 们 使 用 变量 来 区 分 不 同 的 哲学 家 ， 使 用 函数 

Ux) r(x) 分 别 表示 哲学 家 * 左 侧 与 右 侧 的 又 子 。 这 两 个 又 子 是 变迁 v 的 前 置 

条 件 ， 也 是 变迁 "返回 的 后 置 条 件 。 只 需要 增加 更 多 的 令 牌 ， 这 个 例子 可 以 很 容 

易 地 扩 展 到 哲学 家 n >3 的 情况 。 为 了 与 图 2. 55 相对 应 ， 网 络 的 结构 并 没有 发 生 
变化 。 


2.6.5 评估 
Petri 网 的 关键 优点 是 其 对 因果 依赖 进行 模型 化 的 能 力 。 标 准 Petri 网 没有 时 间 概 














O 有 时 也 可 以 考虑 令 牌 使 用 不 同 的 颜色 。 
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念 ， 在 基于 对 变迁 以 及 它们 的 前 置 、 后 置 条 件 的 分 析 后 ， 立 即 由 本 地 作出 决策 。 因 
此 ， 它 可 以 用 于 地 理 上 的 分 布 式 系统 进行 建 模 。 更 进一步 ，Petri 网 有 很 强 的 理论 基 
础 ， 它 可 以 简化 系统 属性 的 描述 。Petri 网 并 不 需要 是 确定 系统 ， 不 同 的 激励 时 序 可 
以 导致 不 同 的 结果 。Petri 网 的 描述 能 力 使 其 构成 了 其 他 一 些 MoC， 包 含有 限 状 态 机 。 

在 一 些 场景 中 ， 它 的 长 处 也 同时 就 是 它 的 缺点 。 如 果 模 型 中 需要 明确 的 时 间 ， 
则 就 不 能 使 用 标准 Petri 网 。 标 准 Petri 网 也 不 能 对 分 层 架构 进行 建 模 ， 它 也 没有 纺 
程 语言 的 要 素 ， 它 很 难 对 数据 进行 表达 。 

为 了 避 开 这 些 缺点 ， 现 在 有 了 许多 扩展 版 本 的 Petri 网 。 但 是 并 没有 一 个 通用 
的 扩展 版 本 可 以 满足 本 章 开始 提 到 的 所 有 需求 。 源 于 分 布 式 计算 的 增长 ，Petri 网 
也 变 得 非常 流行 。 

包含 扩展 Petri 网 的 UML 被 称 为 活动 图 (Activity Diagrams) 。 扩 展 包含 可 以 表 
示 决 策 的 符号 ( 像 普通 的 流程 图 ) ， 这 些 符号 的 位 置 与 SDL 类 似 。 图 2. 57 展示 了 


这 样 一 个 例子 。 
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图 2.57 活动 图 [Kobryn, 2001] 
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这 个 例子 展示 了 遵守 标准 的 一 个 流程 。 控 制 的 分 叉 与 汇聚 相应 于 Petri 网 中 的 
变迁 ， 同 时 它 也 使 用 了 最 初 在 Petri 网 中 使 用 的 一 些 符号 (水 平 线 ) KRKE 
号 代表 了 决策 。 这 些 活动 被 分 组 成 “活动 通道 ” (在 垂直 的 点 画 线 区 域 ) ， 因 此 可 
以 更 容易 地 观察 到 不 同 的 责任 以 及 文档 的 交换 。 有 趣 的 是 ， 像 Petri 网 这 样 的 技术 
在 一 开始 并 没有 成 为 主流 ， 直 到 多 年 之 后 ， 它 才 因 为 被 UML 包含 在 内 而 得 以 推广 。 


2.7 基于 离散 事件 的 语言 


基于 离散 事件 的 计算 模型 是 基于 事件 以 及 事件 处 理 的 仿真 都 是 随时 间 变 化 的 这 
一 想法 。 在 这 个 模型 中 ， 使 用 一 个 队列 来 存储 后 续 事 件 ， 这 些 事件 按 它们 被 处 理 的 
先后 顺序 有 序 存储 。 在 这 种 语言 的 语法 中 ， 去 掉 了 对 队列 中 与 当前 时 间 有 关联 的 事 
件 ， 执 行 相应 的 行为 ， 同 样 也 可 以 将 新 的 事件 插入 到 队列 中 。 即 使 没有 可 执行 的 事 
件 ， 时 间 也 将 会 增加 。 

人 硬件 描述 语言 (Hardware Description Languages, HDL) 用 于 对 硬件 进行 建 模 ， 
它们 通常 基于 离散 事件 模型 。 这 里 将 一 直 使 用 HDL 作为 离散 事件 建 模 的 例子 ， 后 
续 将 着 重 介绍 硬件 描述 语言 VHDL， 同 时 也 会 简要 介绍 其 他 一 些 HDL。 

软件 编程 语言 与 硬件 描述 语言 的 最 典型 区 别 就 是 硬件 描述 语言 需要 在 HDL 中 
对 时 间 进 行 建 模 ， 另 一 个 区 别 是 描述 不 同 硬件 模块 之 间 的 并 发 性 。 


2.7.1 VHDL 








2.7.1.1 简介 

VHDL 是 HDL 中 的 典型 代表 ， 它 使 用 进程 (Processes) 来 对 并 发 性 进行 建 模 。 
每 个 进程 是 存在 并 发 性 的 硬件 中 的 一 个 组 件 。 对 于 一 些 简 单 的 硬件 组 件 ， 也 许 只 需 
要 单独 的 一 个 进程 就 足够 了 ， 但 对 于 一 些 复杂 的 组 件 ， 也 许 需要 多 个 进程 才能 对 它 
们 的 操作 进行 模型 化 。 进 程 之 间 是 通过 信号 (Signals) 进行 通信 的 。 简 单 地 讲 ， 信 
号 在 VHDL 中 对 应 着 物理 连接 [电线 (Wires) ] 。 

VHDL 的 起 源 可 以 追溯 到 20 世纪 80 年 代 。 在 那 时 ， 大 部 分 的 系统 设计 都 使 用 
图 形 化 的 HDL， 而 使 用 最 广泛 的 模块 是 门 电路 。 但 是 ， 在 使 用 图 形 化 HDL 的 基础 
上 ， 仍 然 可 以 使 用 文本 化 的 HDL。 使 用 文本 化 语言 这 一 方式 的 最 大 好 处 在 于 ， 它 
们 可 以 比较 容易 地 去 表达 一 些 复杂 的 计算 ， 如 包含 着 变量 、 循 环 、 函 数 参 数 以 及 和 迭 
代 的 计算 。 相 应 地 ， 当 数字 系统 在 80 年 代 变 得 更 加 复杂 时 ， 文 本 化 的 HDL 几乎 完 
全 取代 了 图 形 化 的 HDL。 文 本 化 的 HDL 在 最 初 只 是 大 学 的 研究 项 目 ， 这 可 以 参考 
Mermet 等 人 [Mermet et al. , 1998] 就 当时 欧洲 地 区 使 用 的 设计 语言 的 一 个 调查 。 
MIMOLA 就 是 其 中 一 种 语言 ， 本 书 的 作者 也 参与 了 其 设计 与 实现 工作 [ Marwedel 
and Schenk, 1993], ，[ Marwedel，2008b] 。 当 VHDL 以 及 其 竞争 对 手 Verilog 被 推广 
后 ， 文 本 化 的 编程 语言 也 开始 更 加 流行 。 
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VHDL 起 源 于 美国 国防 部 ( Department of Defense, DoD) 的 VHSIC mH, VH- 
SIC 是 Very High Speed Integrated Circuits? 的 缩写 。 在 最 初 阶段 ，VHDL ( VHSIC 硬 
件 描述 语言 ) 的 设计 是 由 三 家 公司 完成 的 ，IBM 、Jntermetrics 与 Texas Instruments 
公司 。VHDL 的 第 一 个 版 本 发 布 于 1984 年 ， 而 后 ，VHDL 成 为 IEEE 标准 ， 即 IEEE 
1076, IEEE 1076 关于 VHDL 的 第 一 个 版 本 发 布 于 1987 年 ， 而 后 在 1992 年 、1997 
年 、2002 年 与 2006 年 进行 了 更 新 [ Lewis et al ，2007] 。 由 于 在 语言 中 支持 微分 
方程 方法 ，VHDL- AMS 允许 对 模拟 系统 以 及 混合 信号 系统 进行 建 模 。 由 于 两 种 语 
言 均 擅长 DoD 的 设计 ，VHDL 在 开始 时 使 用 了 ADA, HF ADS 基于 PASCAL, 
此 VHDL 有 许多 语法 与 PASCAL 很 相似 。 但 是 ，VHDL 的 语法 定义 更 加 复杂 ， 并 和 且 
它 的 语法 不 允许 有 任何 歧义 。 本 书 ， 将 仅 集中 在 VHDL 的 某 些 概念 上 ， 这 些 概念 
在 其 他 语言 中 也 会 非常 有 用 。 关 于 VHDL 的 详细 讨论 不 在 本 书 的 范围 内 ，VHDL 的 
标准 可 以 从 IEEE 得 到 (参考 [IEEE，2002]) 。 
2.7.1.2 实体 与 结构 体 

与 其 他 HDL 一 样 ，VHDL 含有 对 硬件 模块 进行 并 行 操作 的 方法 。 硬 件 模 块 被 称 
为 设计 实体 (Design Entities) 或 VHDL 实体 (VHDL Entities) 。 实 体 又 包含 了 描述 
并 发 操作 的 进程 (Processes) 。 根 据 VHDL 语法 ,设计 实体 由 两 部 分 组 成 :实体 声明 
(Entity Declaration) 以 及 一 个 (或 多 个 ) BERK (Architectures) ( 见 图 2.58)。 


实体 声明 


结构 体 1 结构 体 ? | | 结构 体 3 























图 2.58 包含 声明 与 结构 体 的 实体 


对 于 每 个 实体 ， 默 认 将 使 用 最 近 被 使 a suni 
用 最 多 的 结构 体 ， 使 用 其 他 结构 体 将 另 作 b Mull-edder en 
说 明 。 结 构 体 可 以 包含 多 个 进程 。 en E 


下 面 来 讨论 全 加 器 的 例子 。 全 加 器 有 3 图 2.59 全 加 器 及 其 接口 信和 号 
个 输入 端口 及 两 个 输出 端口 〈 见 图 2. 59), 
以 下 是 相应 于 图 2. 59 的 一 个 实体 声明 : 
entity full_adder is -- 实体 声明 
port (a, b, carry-in: in Bit, -- 输入 端口 
sum, carry_out: out Bit); -- 输出 端口 
end full_adder; 


两 个 连 字 符 (--) 后 是 注释 的 开始 ， 注 释 语 句 一 直到 整 行 结束 。 结 构 体 由 结 








O ”网络 的 设计 也 是 VHSIC 的 一 个 内 容 。 
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构 体 名 及 结构 体内 容 构成 。 需 要 区 分 出 不 同类 型 的 结构 体 ， 尤 其 是 组 织 型 (Struc 
tural) 结构 体 及 行为 型 (Behavioral) 结构 体 。 下 面 将 以 全 加 器 为 例 来 分 析 一 下 两 
者 之 间 的 差异 。 行 为 型 结构 体 包含 了 足够 的 信息 ， 从 而 可 以 从 输入 信和 号 与 本 地 状态 
《如 果 有 的 话 ) 计算 出 输出 信号 以 及 输出 的 时 序 行为 。 如 下 展示 了 这 样 的 一 个 例子 
(< = 表示 对 信和 号 赋值 ) : 
architecture behavior of full_adder is -- 结构 体 
begin 
Sum <= (a xor b) xor carry_in after 10 ns; 
carry_out <= (a and b) or (a and carry-in) or 
(b and carry_in) after 10 ns; 
end behavior; 
基于 VHDL 的 仿真 器 可 以 根据 上 面 描述 的 全 加 器 输入 端的 激励 ， 从 而 显示 出 
输出 信号 波形 。 与 此 相对 应 ， 组 织 型 结构 体 在 对 实体 结构 的 描述 方面 显得 更 加 简 
单 。 如 全 加 器 模型 可 以 使 用 包含 3 个 模块 的 实体 来 表示 (ILE 2.60), il ~i3 分 别 
是 半 加 器 或 者 门 电路 。 




















full_adder 
X i3: 
Bo ite or_ | | carry_out 
b 一 [>| halt adder Horz] gate] 
; l2: 
a ~ half_adder sum 


























Al 2.60 组 织 型 全 加 器 的 电路 图 


在 1987 年 版 本 的 VHDL 中 ,模块 必须 首先 进行 声明 。 这 种 声明 与 其 他 语言 
的 声明 非常 相似 (同时 它们 的 功能 也 是 一 样 的 ) 。 即 使 在 VHDL 的 数据 库 中 没有 存 
储 关于 模块 的 全 部 信息 (这 种 情况 可 能 发 生 在 被 称 为 至 顶 向 下 的 设计 中 )， 模 块 本 
身 也 可 以 提供 必需 的 信息 。 从 1992 年 版 本 的 VHDL 以 后 ， 如 果 已 经 在 模块 库 中 有 
相关 模块 的 存储 ， 则 并 不 需要 这 些 声明 了 。 

局 部 的 模块 与 实体 端口 之 间 的 连接 关系 被 称 为 端口 映射 (Port Maps ) 。 下 面 的 
VHDL 代码 表示 了 图 2. 60 中 的 组 织 型 结构 体 ， 

architecture structure of fulladder is -- 结构 体 开始 

component half_adder 





port (in1, in2: in Bit; carry: out Bit; sum: out Bit); 
end component; 
component or_gate 

port (in1, in2: in Bit; o: out Bit); 


end component; 
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signal x, y, z: Bit; -- 局 部 信号 
begin -- 端口 映射 段 
i1: half_adder -- Mh B8il 


port map (a, b, x, y); -- 端口 连接 
i2: half adder port map (y, carry-in, z, sum); 
i3: or.gate port map (x, z, carry_out); 
end structure; 
2.7.1.3 VHDL 的 进程 与 赋值 

VHDL 将 所 有 上 面 提 到 的 模块 都 视 为 进程 。 上 面 使 用 的 关于 进程 的 语法 都 是 简 
要 的 介绍 ， 关 于 进程 的 语法 如 下 : 

label : -- 可 选 

process 

declarations -- 可 选 
begin 

statements-- 可 选 
end process ; 

赋值 是 语句 的 一 种 。 在 VHDL 中 有 两 种 形式 的 赋值 : 

1) 变量 赋值 : 变量 赋值 的 语法 为 

variable : = expression 

无 论 在 什么 时 候 执行 到 这 条 赋值 语句 ， 表 达 式 都 将 被 重新 计算 并 且 变 量 被 立即 
重新 赋值 。 这 种 赋值 行为 与 普通 编程 语言 中 的 赋值 语句 其 实 是 一 样 的 。 

2) 信号 赋值 : 信号 与 信号 赋值 的 本 意 是 希望 能 更 准确 地 对 真实 硬件 系统 中 的 
电信 号 进行 描述 。 与 信号 相关 的 值 都 是 瞬时 的 。 在 VHDL 中 ， 这 种 时 间 与 数值 的 
关系 使 用 波形 (Waveforms) 来 进行 表示 ， 从 信号 赋值 中 可 以 计算 出 波形 。 关 于 信 
号 赋值 的 语法 如 下 : 

signal <= expression; 

signal <= transport expression after delay; 

signal <= expression after delay; 

signal <= reject time inertial expression after delay; 

无 论 此 赋值 何 时 被 执行 ， 表 达 式 总 是 被 重新 计算 ， 并 且 将 计算 结果 用 于 波形 中 
的 将 来 时 刻 。 为 了 计算 将 来 的 值 ， 假 定 仿真 器 含有 一 个 事件 队列 ， 它 存储 着 在 当前 
时 间 之 后 将 发 生 的 事件 。 队 列 中 的 元 素 按 时 间 进 行 排序 ， 存 储 着 将 来 时 刻 发 生 的 事 
件 (如 更 新 信号 ) 。 执 行 一 次 信号 赋值 将 在 队列 中 产生 一 个 实体 。 每 个 实体 都 包含 
着 执行 事件 的 时 间 、 受 影响 的 信号 以 及 所 赋 的 值 。 对 于 没有 包含 after 语句 的 赋值 
(第 一 种 语法 格式 ) ， 实 体 将 把 当前 的 仿真 时 间作 为 赋值 操作 发 生 的 时 刻 。 在 这 种 
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情况 下 ， 赋 值 的 动作 将 在 一 个 无 限 小 的 时 刻 后 发 生 ， 称 为 8 延 时 (参考 下 面 的 内 
容 ) 。 这 样 就 使 人 们 在 不 必 改 变 微小 时 间 的 前 提 下 可 以 更 新 信号。 

对 于 包含 ransport 前 缀 的 赋值 (第 二 种 语法 格式 ) ， 信 号 将 在 延迟 指定 的 时 间 
后 被 更 新 。 这 种 格式 的 赋值 被 称 为 传输 延迟 模型 (Transport Delay Model) 。 这 种 
模型 是 基于 导线 的 行为 : 信号 会 在 导线 上 (作为 一 种 初步 的 估计 ) 产生 延 时 。 即 
使 是 短暂 的 脉冲 信号 ， 它 也 会 在 导线 上 有 传输 延 时 。 即 使 传输 延 时 的 主要 应 用 是 对 
导线 的 建 模 ， 它 也 可 以 用 于 逻辑 电路 。 假 定 我 们 使 用 传输 延 时 赋值 来 对 一 个 简单 的 
或 - 门 电路 进行 建 模 : 


c < = transport a or b after 10 ns; 





















































即使 是 短暂 的 脉冲 ,第 二 Marori A ae E EA 
种 语法 格式 模型 也 会 保证 它 的 “| = | 
发 送 ( 见 图 2.61)。 Bo 

经 历 传输 延迟 的 信号 赋值 二 
时 ， 它 将 会 根据 当前 计算 出 的 | o su OOO 
SRNR. MUS a S k e a o E oda 


实体 (如 果 首 先 以 较 大 的 延迟 
进行 了 一 次 赋值 ， 而 后 又 以 较 
小 的 延迟 进行 了 赋值 ， 则 先前 较 大 延迟 的 对 应 操作 会 被 删除 ) 。 

对 于 信号 赋值 中 包含 after 但 不 包含 transport 的 语句 ， 都 会 假定 含有 惯性 延迟 
(Inertial Delay) 。 惯 性 延迟 模型 反映 了 实际 电路 都 会 有 -一些 “惯性 "， 这 也 就 意味 
者 可 以 抑制 信号 毛刺 的 产生 。 对 于 信和 号 赋值 的 第 三 种 形式 ， 小 于 指定 延迟 时 间 的 信 
号 改变 都 将 被 忽略 。 对 于 第 四 种 语法 形式 ， 所 有 小 于 指定 数量 的 信号 改变 都 将 从 预 
期 的 波形 中 消除 。 假 设 使 用 一 个 简单 的 与 门 来 对 惯性 延迟 进行 建 模 : 


c< =a orb after 10 ns; 


图 2.61 带 传输 延迟 的 门 电 路 模型 





























a Sei ee AL Rp ok g fl oe ty Pps 
的 信号 毛刺 就 被 消除 了 ( 见 图 “| | | 
2.62). Ee 

惯性 延迟 的 实现 结果 依赖 ii: i 
于 从 预期 波形 图 中 移 除 实体 的 TEES | bail OH 
Wi. ERERMSRMBR S a a ee aif 6 um 
的 详细 原则 。 


eae : 2.62 ”惯性 延迟 的 E 
相对 于 赋值 ， 进 程 可 以 有 2-62 MERRIE 


wait ( 等待) 状态 ， 此 状态 可 

将 一 个 进程 挂 起 。 下 面 列举 了 wait 状态 的 种 类 
1) wait on 信号 列表 ; 挂 起 直到 信和 号 列表 中 有 信号 发 生 改变 ; 
2) wait until 条 件 ; 挂 起 直到 条 件 被 满足 ， 如 a = “1”; 
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3) wait for 时 间 ; 挂 起 一 段 指定 的 时 间 ; 
4) wait ; 无 限 挂 起 。 
作为 对 wait 状态 的 另 一 种 解释 ， 也 可 以 将 一 些 信 号 添加 到 进程 的 开头 。 在 这 种 
例子 中 ， 只 要 列表 中 的 信号 发 生变 化 ， 则 进程 就 被 激活 。 例 如 ， 在 下 面 的 与 门 模型 
中 ， 只 要 输入 信号 的 值 发 生变 化 ， 则 进程 的 主体 将 被 执行 一 次 ， 而 后 再 从 开始 处 重 
新 执行 。 
process(x, y) begin 
prod <=x andy; 
end process; 
这 个 模型 也 等 价 于 
process begin 
prod <=x andy; 
wait on x,y; 
end process; 
2.7.1.4 VHDL 的 仿真 周期 
根据 原始 标准 文档 [IEEE，1997] 的 介绍 ，VHDL 模型 的 执行 可 以 描述 如 
下 :“ 在 一 个 模型 的 描述 中 ， 它 的 执行 由 一 个 初始 化 阶段 以 及 多 个 进程 状态 的 重 
复 执行 构成 。 所 有 进程 状态 的 一 次 重复 被 称 为 一 个 仿真 周期 。 在 此 周期 中 ， 模 型 
描述 中 涉及 的 所 有 信号 的 值 都 会 被 重新 计算 。 如 果 重 新 计算 在 给 定 信号 上 产生 了 
事件 ， 而 又 有 进程 状态 对 此 信和 号 敏感 ， 则 进程 将 作为 仿真 周期 的 一 部 分 得 到 
执行 。 
VHDL 的 初始 化 阶段 主要 是 完成 信号 的 初始 状态 设置 ， 并 且 每 个 进程 只 会 执 
一 次 。 它 在 标准 里 的 描述 如 下 9 ; 
“在 初始 化 阶段 开始 时 ， 当 前 时 间 7 假定 为 0ns， 初始化 阶段 包含 以 下 
步骤 9 : 
1) 对 于 每 一 个 被 明确 声明 的 信号 ， 其 驱动 值 和 生效 值 都 被 会 重新 计算 ， 信 
号 的 当前 值 被 设置 为 生效 值 。 生 效 值 是 假定 在 仿真 时 刻 无 限 之 前 的 一 个 信号 
{i = 
2) 每 个 … 模 型 中 的 每 个 进程 在 其 挂 起 之 前 一 直 执 行 。… 
3) 下 一 次 仿真 周期 的 时 间 7，( 在 本 例 中 即 第 一 个 仿真 周期 )， 它 是 根据 仿真 
周期 的 步骤 5) 计算 得 出 的 ( 见 下 面 的 叙述 ) 。” 
每 个 仿真 周期 从 将 当前 时 间 设 置 为 必须 去 考虑 状态 改变 的 下 一 个 时 刻 开始 。7， 


l 


> 





O 不 考虑 在 VHDL 的 1997 版 本 中 对 称 为 推迟 ( Postponed) 进程 中 需要 明确 的 信号 声明 的 讨论 。 
O 为 了 减 小 标准 中 大 量 细节 的 影响 ， 部 分 内 容 〈 以 “…” 代 替 的 部 分 ) 在 引用 时 即 被 省 略 。 
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可 以 在 初始 化 期 间 计 算 ， 或 者 在 仿真 周期 的 最 后 一 次 执行 过 程 中 进行 计算 。 在 当前 
时 间 达 到 它 的 最 大 值 TIME' HIGH 时 ， 仿 真 即 结束 。 根 据 原始 的 标准 文档 ， 仿 真 周 
期 的 概念 被 描述 如 下 :“ 一 个 仿真 周期 包含 着 如 下 的 步 又 ， 

1) 当前 时 刻 T, 被 设置 为 与 7, 相等 。 当 T, = TIME’ HIGH 并 且 没有 活动 的 驱 
动 或 者 在 T, 时 刻 没有 进程 恢复 执行 ， 则 仿真 完成 。 

2) 模型 中 每 一 个 显 式 的 活动 信号 都 会 被 更 新 。( 其 结果 可 能 是 事件 。)”.… 

在 当前 仿真 周期 的 前 一 些 周期 中 ,将 会 计算 一 些 信号 的 后 续 值 。 WR T, 与 这 
些 值 变 为 有 效 的 时 刻 相 对 应 ， 则 它们 被 重新 赋值 。 在 执行 一 个 仿真 周期 时 ， 信 号 的 
赋值 不 会 立即 发 生 ， 它 们 在 下 一 个 仿真 周期 之 前 均 不 会 发 生 。 信 号 在 改变 它们 的 什 
时 将 产生 事件 ， 事 件 可 能 会 使 对 相应 信号 敏感 的 进程 得 到 执行 。 

3) “对 于 一 个 进程 P， 如 果 己 对 某 一 个 信号 $ 敏感 ， 而 在 此 仿真 周期 中 5S 上 又 
有 事件 发 生 ， 则 P 将 重新 开始 执行 。 
4) 每 一 个 … 在 当前 仿真 周期 重新 开始 执行 的 进程 将 在 它 被 挂 起 之 前 一 吉 
运行 。 
5) 下 一 个 仿真 周期 所 需要 的 时 间 7, 由 最 早 将 其 设置 的 如 下 值 决定 ; 
O TIME’ HIGH (仿真 的 结束 时 间 ); 
D 某 个 驱动 变 为 活动 的 下 一 个 时 间 (这 是 下 一 个 实例 的 时 间 ， 驱 动 指定 的 新 
的 值 ); 

© 进程 开始 执行 的 下 一 次 时 间 (这 个 时 间 由 wait for 的 状态 决定 ) 。 

如 果 T, = 7.， 那 下 一 个 仿真 周期 (如 果 有 ) 将 是 一 个 8 周期 。 

图 2. 63 展示 了 仿真 周期 迭代 的 特点 。 

5 一 直 是 一 个 有 争议 的 话题 。 它 的 目的 是 在 某 些 即使 是 用 户 没有 特别 指定 的 情 
次 下 ， 在 仿真 中 引入 一 个 无 限 小 的 延 时 。 举 一 个 例子 来 分 析 一 下 这 个 无 限 小 的 延 时 
对 触发 器 的 影响 。 图 2. 64 展示 了 和 触发 器 的 电路 示意 图 。 














仿真 开始 
| 信号 驱动 的 后 续 值 
ee S “i na 
给 信号 赋 新 值 测试 进程 = 
激活 所 有 对 信号 改变 敏感 的 进程 ae 
图 2.63 VHDL 的 仿真 周期 图 2.64 RS 触发 器 


使 用 VHDL 对 这 一 触发 器 进行 建 模 如 下 : 
entity RS_Flipflop is 
port (R: in BIT; -- 复位 
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S:in BIT;  -- 置 位 
Q: inout BIT; -- 输出 
nQ: inout BIT; ); -- 端 

end RS-_Flipflop; 

architecture one of RS_Flipflop is 

begin 

process: (R,S,Q,nQ) 
begin 
Q <=RnornQ; nQ <= S nor Q; 
end process; 

end one; 

由 于 端口 Q 与 nQ 在 内 部 还 有 读 操 作 ， 因 此 它们 不 能 仅仅 设置 为 out ， 而 必须 
被 设置 为 inout 。 图 2. 65 列 出 了 上 面 的 模型 中 信号 更 新 的 仿真 时 间 。 在 每 一 个 周 
期 , 信号 的 变换 都 是 通过 其 中 一 个 门 电路 传输 。 在 35 之 后 ,仿真 即 终 止 。 由 于 Q 
已 经 是 “0”， 因 此 在 最 后 一 个 周期 中 没有 改变 任何 信号 。 











| <Ons Ons Ons+5 Ons+25 Ons+36 | 
R 0 1 l l l 
S 0 0 0 0 0 
Q 1 1 0 0 0 
nQ 0 0 0 1 ] 








图 2.65 RS 触发 器 的 5 周期 


6 可 以 看 作 一 个 非常 小 的 时 间 单 位 ， 但 它 在 现实 中 又 是 存在 的 ， 它 保证 了 仿真 
时 的 因果 关系 ， 从 而 使 仿真 结果 不 依赖 于 模型 中 各 部 分 的 仿真 执行 顺序 。 这 一 特性 
依赖 于 新 的 信号 值 的 计算 与 信号 赋值 的 分 离 。 在 一 个 含 如 下 语句 的 模型 中 : 

a< =b; 

b< =a; 
信号 a 与 信号 b 的 值 总 会 被 互 换 ， 如 果 赋 值 是 即时 发 生 的 ， 则 最 终 的 结果 将 依赖 于 
执行 赋值 操作 的 顺序 。 因 此 ，VHDL 模型 具有 确定 性 。 这 也 就 是 从 一 个 具有 确定 行 
为 的 实际 电路 的 仿真 中 期 望 得 到 的 。 

在 从 当前 时 间 T, 开始 执行 之 前 ， 可 以 有 随机 个 68。 这 时 有 可 能 会 产生 无 限 循 
环 ， 这 种 可 能 性 就 会 引起 混淆 。 为 了 避免 这 种 可 能 性 ， 方 法 之 一 就 是 禁止 使 用 零 延 
时 ， 在 触发 器 的 模型 中 就 使 用 了 这 种 方法 。 

使 用 信和 号 来 传输 数值 的 改变 ， 可 以 很 容易 地 使 用 观察 者 模型 来 实现 。 相 对 
于 SDF， 观 察 者 的 数量 是 可 以 改变 的 ， 这 取决 于 等 待 着 一 个 信号 改变 的 进程 
数量 。 








第 2 章 规范 与 建 模 65 





VHDL 模型 是 如 何 进 行 通信 的 呢 ? VHDL 的 语法 描述 高 度 依赖 着 惟一 的 〈Sin- 
gle), SH) (Centralized) 后 续 事 件 队 列 ， 在 队列 中 存储 了 所 有 信号 的 后 续 值 。 
这 个 队列 的 目的 并 不 在 于 实现 异步 的 消息 传递 。 因 此 ， 这 一 队列 应 该 由 仿真 的 内 核 
来 进行 访问 ， 以 非 分 布 式 模式 ， 每 次 只 访问 队列 中 的 一 个 实体 。 然 而 ， 对 于 这 种 分 
布 式 的 VHDL 仿真 ， 其 效率 也 必然 比较 低 。 即使 不 使 用 基于 消息 的 通信 ， 所 有 模 
型 中 的 组 件 都 可 以 访问 信号 的 值 以 及 在 其 访问 范围 内 的 变量 。 因 此 ， 更 多 地 将 
VHDL 与 基于 共享 内 存 的 通信 实现 联系 在 一 起 。 但 是 ， 基 于 FIFO 的 消息 传递 也 可 
以 在 VHDL 仿真 器 项 层 得 到 实现 。 
2.7.1.5 多 值 逻 辑 与 IEEE 1164 

在 本 书 中 ， 约 定 嵌 入 式 系统 都 是 基于 二 进 制 逻辑 实现 的 ， 然 而 有 时 也 需要 使 用 
两 个 以 上 的 值 来 对 某 些 系统 进行 建 模 。 举 个 例子 ， 也 许 系统 中 的 电信 号 有 不 同 的 强 
度 ， 有 必要 计算 出 当 把 两 个 或 多 个 电信 号 的 源 连 接 在 一 起 时 的 信号 强度 与 电 平 。 接 
下 来 ， 因 此 有 必要 区 分 信号 (Signal) 的 电 平 (Level) 与 强度 (Strength) : 电 平 
是 对 信号 电压 的 抽象 ， 而 强度 是 对 电压 源 阻抗 (电阻 ) 的 抽象 。 使 用 离散 信号 的 
值 来 表示 信号 的 电 平 与 强度 。 使 用 离散 信号 的 强度 ， 可 以 避免 去 求解 基 尔 霍 夫 公式 
( Kirchhoff’ s Equations) , 同时 也 避免 了 使 用 电子 工程 领域 的 模拟 电路 模型 。 对 于 未 
知 的 电子 信号 ， 将 为 其 指定 信号 值 。 

在 实践 中 ， 电 子 设计 系统 可 以 使 用 多 值 。 一 些 系统 只 允许 两 个 值 ， 某 些 系统 也 
允许 9 个 或 46 个 。 使 用 这 种 多 值 的 总 体 目的 ， 首 先是 为 了 避免 对 电路 网 络 公式 的 
解析 〈 如 基 尔 霍 夫 定 律 ) ， 其 次 是 保证 当前 的 系统 有 足够 的 精度 。 接 下 来 将 展示 确 
定 多 值 化 系统 的 技术 以 及 这 些 多 值 之 间 的 关系 ， 同 时 使 用 电子 信号 的 强度 作为 区 分 
这 些 多 值 的 关键 参数 。Hayes [Hayes, 1982] 对 这 种 建立 多 值 的 系统 化 方法 进行 了 
讲述 ， 被 称 为 CSA 理论 。CSA Æ “Eis (Connector), HMS (Switch), FW 
ft (Attenuator)” 的 缩写 ， 这 3 种 模块 是 CSA 理论 的 关键 元 素 。 下 面 将 展示 在 大 
部 分 场景 中 基于 VHDL 模型 如 何 使 用 多 值 。 

1. 信和 号 强度 〈 两 个 逻辑 值 ) 

这 是 一 种 最 简单 的 情况 ， 从 两 个 逻辑 值 开始 ， 即 "0” 和 ”1’ 。 这 两 个 逻辑 值 有 
着 相同 的 信号 强度 ， 即 如 果 线 上 连接 着 "0 与 '1’ ， 则 无 法 确定 最 终 的 信号 电 
平 值 。 

如 果 既 没有 将 "0” 和 "1” 信 号 连接 到 一 起 的 情况 ， 也 不 会 有 不 同 的 信号 强度 
在 一 个 特定 的 电路 节点 交汇 的 情况 ， 则 两 个 逻辑 值 就 足够 了 。 

2. 信和 号 强度 (3 或 4 个 逻辑 值 ) 

在 某 些 电 路 中 ， 可 能 会 存在 一 些 信号 不 被 任何 输出 驱动 的 情况 。 例 如 ， 当 一 些 





如 系统 可 能 包含 开 集 电极 电路 输出 ( 见 图 2. 66 ZE), WE “FH (pull- 
down)” da PD 处 于 关 断 状态 ， 则 输出 也 将 是 断 开 的 。 对 于 三 态 输出 ( 见 图 
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2.66 右 图 ) ， 使 能 信号 为 "0” 时 ， 与 门 〈 图 示 为 &) 的 输出 也 将 为 '0，， 同 时 两 个 
晶体 管 都 将 关 断 ， 从 而 输出 4 也 将 断 开 2。 因此， 使 用 适当 的 输入 信号 ， 输 出 可 以 
被 有 效 断 开 。 




















Vop 
输出 4 
输入 PD 
地 
输入 = '0' -> 4 未 连 使 能 = 0 -> ARIE 


图 2.66 有效 的 断 开 输出 信和 号 


很 明显 ， 在 被 断 开 时 的 输出 信号 的 强度 是 已 知 最 弱 的 。 在 某 些 情况 下 ， 信 
号 强度 " Z” 比 0” 和 "1” 还 要 小 。 因 此 ,这样 的 输出 信号 ， 其 电 平 是 未 知 
的 。 这 种 信号 强度 被 称 为 "2Z” 态 。 如 果 一 个 值 为 *"Z” 的 信号 与 男 一 个 信号 相 
连接 ， 则 结果 信号 的 电 平 完全 取决 于 另 一 个 信和 号。 举例 来 说 ， 如 果 两 个 三 态 输 出 
被 连接 到 同一 总 线 上 ， 其 中 一 个 为 '2Z”， 则 总 线 电 平 将 取决 于 第 二 个 信号 的 值 
( 见 图 2.67)。 

在 VHDL 中， 每 个 输出 信号 都 与 一 个 驱动 信号 相关 : 从 多 个 驱动 信号 计算 出 
的 同一 个 信和 号称 为 真 值 ( Resolution)， 用 于 计算 此 真 值 的 函数 被 称 为 真 值 函 数 


(Resolution Functions ) 。 




















Vpp 
gest el 
使 能 ='0 |z- 总 线 
F_ la| Po PD’ 
+ 地 + 








图 2.67 总 线 受 右 侧 输 出 控制 

在 许多 场景 中 ， 逻 辑 值 集 合 CO, P P) RBA {’0’,71’,’2’, 
”代表 了 一 个 信号 强度 与 0” 和 "1 一样 ， 但 信号 电 平 未 知 的 信号 。 准 
确 地 说 ， 使 用 'X ”来 表示 可 能 为 '0” 或 '1” 的 未 知 信 号 值 ， 或 者 某 些 既 不 是 0? 





O 在 实践 中 ， 上 拉 (pull-up) 晶体 管 一 般 是 耗 尽 型 晶体 管 ， 其 三 态 输出 需要 被 反 转 。 
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也 不 是 1” 的 信和 号 值 2 。 

即使 有 多 个 驱动 源 连接 在 一 起 ， 如 果 清 楚 '0' S Z 和 和’ ”之 间 的 转换 顺 
序 ， 仍 然 可 以 比较 容易 地 对 真 值 进行 计算 。 图 2. 68 以 哈 斯 图 (Hasse Diagram) 来 
展示 这 4 个 值 之 间 的 转换 顺序 。 


此 图 中 的 有 向 边 反 映 了 信号 值 之 间 的 控制 与 转换 关 
系 。 有 向 边 定义 的 关系 可 以 表示 为 “ >” 符号。 如 果 a ae 
> b, Wahib: PL RIZ, TX BAR be 
他 的 值 。 基 于 “ > ”所 表示 的 关系 ,定义 另 一 种 关系 图 2 68 Po roz. 
i 0 | 的 转换 顺序 


定义 对 两 个 信号 的 sup 运算 ， 它 将 返回 两 个 信和 号 值 中 
的 最 小 值 (Supremum) , XF c>a 5 c>b, ec 是 oa 与 5 之 中 的 最 小 值 。 如 sup 
CP) ="'0'、sup CZ?) =r 等。 真 值 函数 将 根据 上 面 的 定义 来 
计算 sup 。 此 处 的 最 小 值 与 CSA 理论 中 的 connect 元 素 相 对 应 。 

3. 信号 强度 (7 种 信号 值 ) 

在 许多 电路 中 ， 两 种 信号 强度 并 不 能 满足 对 电路 的 描述 需要 。 使 用 耗 尽 型 晶体 
管 是 需要 多 种 信和 号 值 的 常见 情况 ( 见 图 2. 69) 。 

耗 尽 型 晶体 管 的 作用 与 通过 向 电源 电压 Vo 提供 低 阻抗 通路 的 电阻 类 似 。 前 面 
所 述 的 “下 拉 型 晶体 管 ”PD 与 耗 尽 型 晶体 管 ， 都 是 电路 中 节点 4 的 驱动 源 ， 节 点 
A 的 信号 值 可 以 使 用 真 值 函数 来 计算 。 下 拉 晶 体 管 PD 的 驱动 值 可 能 为 "0 或 'Z?， 
这 取决 于 PD 的 输入 。 耗 尽 型 晶体 管 的 信和 号 值 比 '0'” 和 ”1” 弱 ， 它 与 1” 的 信和 号 
电 平 一 样 。 使 用 "H” 来 表示 耗 尽 型 晶体 管 对 节点 4 的 驱动 值 ， 称 其 为 “1 ae 
辑 "， 相 似 地 ， 可 以 使 用 'L” 来 表示 0 弱 逻 辑 。 HH ”与 'L” 的 可 能 连接 产生 的 结果 
PRA “ACE MSR”, MW RER. X, WAT 3 种 信号 强度 以 及 7 种 逻 
辑 值 1*0”,"1’,”L”,”H?,’W’,”X’,”Z’|。 真 值 同 样 可 以 使 用 这 7 个 值 之 间 的 
偏 序 关系 来 进行 计算 ， 相 应 的 偏 序 关系 如 图 2. 70 所 示 。 























A w’ 
Z N 中 
f PD E “H 
NX ZF 
地 ni z ag 
图 2.69 耗 尽 型 晶体 管 的 输出 图 2.70 集合 PrP, P, 


WP? OL 的 偏 序 关系 





〇 ”还 有 许多 对 'X” 的 其 他 解释 ,但 在 本 书 中 此 处 阐述 的 是 最 有 用 的 说 法 之 一 。 
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这 种 偏 序 关系 同样 可 以 用 于 定义 sup 操作 ， 它 可 以 返回 两 个 参数 中 最 弱 的 值 ， 
Mieup (在 0 )= "0", sup (HZ? yes "A, sup CRH; L’)= ° W, 

0 PTP RAMS AH, BASER, 5 H the St 
类 似 。 增 强 信号 强度 的 器 件 称 为 放大 器 (Amplifiers) ， 减 弱 信 和 号 强度 的 器 件 称 为 训 
减 器 (Attenuators) 。 

4. 10 个 信号 值 (4 种 信号 强度 ) 

在 某 些 场景 下 ，3 个 信号 强度 并 不 够 。 例 如 ， 在 导线 上 可 存储 电荷 的 电路 。 导 
线 的 电 平 在 电路 的 中 间 过 程 中 被 充电 为 相应 的 '0” 或 '1’ 。 这 些 存储 的 电荷 可 以 控 
制 某 些 (高 阻抗 ) 晶体 管 的 输入 。 但 是 ， 即 使 这 些 导 线 与 最 弱 的 信和 号 源 C B 
Sh) 相连 ， 它 们 也 将 无 法 存储 并 保持 信号 值 。 

例如 在 图 2.71 中 ， 使 用 专门 的 输出 来 驱动 总 线 。 

图 2.71 中 的 总 线 有 一 较 高 的 容 。 ， ， 
性 负载 C。 当 函数 /为 0 时 , 将 由 


























设置 为 '1， 从 而 对 电容 C 充电 ;而 ey 
后 将 由 设置 为 "0" 。 当 函数 /的 值 变 msy 
Ay’ 1 ‘ 时 ， 停止 对 总 线 充 电 。 由 于 f 一 一 一 PD 一 [一 区 





耗 尽 型 晶体 管 的 阻抗 较 大 ， 使 用 输 








出 对 总 线 充电 的 过 程 会 比较 缓慢 ， 是 
如 图 2. 69 所 示 ， 这 也 就 是 在 电路 中 图 2.71 总 线 预 充电 


使 用 预 充电 的 关键 原因 。 通 过 常规 
的 下 拉 唱 体 管 PD 放电 的 过 程 则 比较 迅速 。 
对 于 这 样 的 模型 ， 还 需要 比 ”"H” 和 ”LL” 更 弱 , (ANZ? 更 强 的 信号 ， 称 
这 样 的 值 为 “其 弱 信 号 值 ”"， 并且 使 用 'h ”与 "1” 来 表示 ， 其 弱 信 号 值 中 的 未 知 值 
则 用 "w” 来 表示 。 这 样 ， 就 得 到 了 10 个 值 LO, PEP, DP, kR, X, 
W w, Z) 。 使 用 这 些 值 ， 也 可 以 得 到 它们 之 间 的 偏 序 关系 ( 见 图 2. 72)。 
5. 5 个 信号 强度 





人 
到 目前 为 止 ， 均 没有 讨论 过 电源 信 eos 

号 。 它 们 比 目 前 讨论 的 最 强 信 号 还 要 强 。 NY 

如 果 将 电压 信号 也 考虑 在 内 ， 则 可 以 形成 DA oe 

46 值 的 集合 [ Coelho, 1989], {838 % #8 Po y] 

很 少 使 用 这 种 模型 。 
6. IEEE 1164 x k > 预 充电 
在 VHDL 中 ,除了 支持 基本 的 二 值 软 ee ae 

辑 外 ， 并 没有 预先 定义 信号 值 的 数量 。 但 z 38 


是 可 以 在 VHDL 中 自行 定义 , 不 同 的 图 2.72 [Otte ern, 
VHDL 模型 可 以 使 用 不 同 的 数值 集 。 RW Pw’ ”Z| 的 偏 序 关 系 
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但 是 ， 如 果 以 这 样 的 方式 来 提升 VHDL 能 力 ， 会 给 模型 的 可 移植 性 带 来 严峻 
考验 。 为 了 简化 VHDL 模型 的 移植 ，IEEE 定义 了 一 组 标准 的 数值 集 。 这 一 标准 被 
称 为 IEEE 1164， 并 且 在 许多 系统 模型 中 被 使 用 。IEEE 1164 有 9 个 值 10, 
-这 其 中 的 前 7 个 值 与 前 面 描述 的 7 个 
言 号 值 一 致 。V” 表示 未 初始 化 的 值 ， 它 被 仿真 器 用 于 表示 未 明确 初始 化 的 信和 号。 

”表示 输入 无 关 (Input Don’ t Care) ， 需 要 对 这 个 值 作 一 些 解释 : 通常 硬 
件 描述 语言 都 被 用 于 描述 布尔 函数 。VHDL 的 seleet 语句 是 实现 这 一 功能 的 简单 方 
式 ， 它 与 其 他 语言 中 的 switch 与 case 语句 类 似 ， 但 它 又 与 ADA 中 的 select 语句 不 
一 样 。 
例如 ， 假 定 要 表达 如 下 的 布尔 函数 : 
fla, b, c) =ab+be 
假定 a=65=c = "0” IN SARE, WP RRR Lost: 
f<=selecta&b&c --& 表 示 与 
‘when "10-" -- 相应 于 第 一 种 情况 
"1 when "-11" -- 相应 于 第 二 种 情况 
X' when "000" 

如 果 按 这 种 方式 ， 如 上 函数 可 以 很 容易 地 转化 为 VHDL 程序 。 但 不 幸 的 是 ， 
VHDL 中 select 语句 所 表示 的 内 容 与 此 处 完全 不 一 样 。 因 为 IEEE 1164 只 定义 了 可 
能 的 信号 值 的 集合 ， 它 并 未 对 '- ”作出 明确 定义 。 对 上 面 所 述 的 select 语句 ， 
VHDL 工具 检查 选择 表达 式 (本 例 中 的 a & b & ce) 是 否 与 when 语句 中 的 值 相等 。 
例如 ， 它 检查 a & b &c 是 否 与 “10-” 相 等 时 ,这 其 中 的 '- ”可 以 是 任意 值 。 那 
么 ，VHDL 系统 将 检查 < 是 否 等 于 '-'， 由 于 任何 变量 均 没 有 被 赋值 为 '-”， 因 此 
比较 结果 将 永远 为 假 。 出 于 VHDL 自身 定义 的 数值 集 的 灵活 性 ， 才 带 来 了 这 种 无 
关 值 的 不 方便 9 。 

2.7.1.5 市 前 面部 分 讨论 的 性 质 如 下 : 它 使 得 得 出 IEEE 1164 建 模 能 力 的 总 
结 。IEEE 标准 基于 前 面 3. 描述 的 7 值 数值 集 ， 因 此 它 可 以 对 包含 耗 尽 型 晶体 管 的 
电路 进行 建 模 ， 但 它 并 不 适合 对 充电 设备 进行 建 模 S 。 


2.7.2 SystemC 


由 于 偶 向 于 使 用 软件 来 实现 系统 功能 这 一 趋势 的 发 展 ， 越 来 越 多 的 艇 入 式 系统 
既 包 含 软件 又 包含 硬件 。 大 部 分 的 和 谈 人 式 系统 软件 都 是 用 C 语言 来 实现 的 ， 例 如 
用 于 实现 MPEG 1/2/4 标准 的 做人 式 系统 ， 以 及 移动 通信 的 CSM 与 UMTS 编码 器 








O ”这 一 问题 已 经 在 VHDL 2006 中 修正 [Lewis et al. , 2007] 。 
O ”如果 在 模型 中 并 不 需要 耗 尽 型 晶体 管 或 者 上 拉 电 阻 ， 可 以 将 弱 信 号 值 理 解 为 充电 电荷 。 但 由 于 上 拉 
电阻 在 系统 中 已 经 非常 常见 ， 因 此 这 种 做 法 并 不 现实 。 
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标准 。 这 些 标准 通常 都 可 以 在 “参考 实现 ”中 查找 到 ， 一 般 都 是 未 经 优化 的 C 语 
言 实现 ， 不 过 都 提供 了 所 要 求 的 功能 。 这 就 形成 了 基于 VHDL 5 Verilog 设计 方法 
的 缺点 ， 即 为 了 产生 相应 的 硬件 电路 ， 这 些 标准 都 需要 被 重 写 。 

硬件 与 软件 协同 仿真 需要 硬件 与 软件 之 间 的 交互 。 这 通常 会 影响 仿真 效率 ， 并 
且 会 带 来 用 户 接口 的 不 一 致 ， 同 时 这 也 就 要 求 开 发 者 去 学 习 多 种 语言 。 

因此 ， 有 必要 对 使 用 软件 语言 来 表达 硬件 结构 的 技术 进行 研究 。 使 用 软件 语言 
对 硬件 进行 建 模 ， 必 须要 解决 如 下 一 些 基 本 问题 : 

1) 并 发 性 (Concurrency) ， 这 是 硬件 的 特点 ， 需 要 在 软件 模型 中 实现 ; 

2) 能 表达 仿真 时 间 (Time) ; 

3) 能 方便 地 表达 多 值 逻 辑 (Multiple- valued Logic) 与 真 值 (Resolution) ; 

4) 需要 保证 大 部 分 功能 电路 的 确定 性 行为 (Determinate Behavior) 。 

SystemC™ [SystemC, 2010], [ Open SystemC Initiative, 2005] 被 设计 用 于 解 
决 以 上 这 些 问 题 ， 它 是 C ++ 的 类 库 。SystemC 可 以 使 用 C 或 C ++ 来 描述 规范 ， 构 
造 出 与 类 库 之 间 适 当 的 参考 。 

SystemC 包含 着 进程 并 行 执行 的 概念 。 它 的 仿真 语法 与 VHDL 类 似 ， 也 包含 了 
如 何 表 达 6 周期 。 这 些 进程 的 执行 是 通过 敏感 信号 表 以 及 调用 wait 原 语 来 控制 的 。 
敏感 信号 表 的 概念 还 包含 了 动态 敏感 信号 表 。 

SystemC 还 包含 着 时 间 模 型 。 早 期 的 SystemC 1.0 使 用 浮 点 数 来 表示 时 间 ， 而 
在 当前 的 版 本 标准 中 ， 更 推荐 使 用 整形 数 表示 的 时 间 。SystemC 支持 物理 时 间 单 
fi, Ups, ns 及 ps 等 。 

SystemC 的 数据 类 型 包含 了 所 有 常见 的 硬件 种 类 : 四 值 逻 辑 (0 17,” X’ 
UEZ) 以 及 不 同 长 度 的 位 向 量 。 由 于 使 用 了 定点 数据 类 型 ， 数 字 信和 号 处 理应 用 
的 编写 得 以 简化 。 

除非 使 用 特定 的 建 模 类 型 ， 通 常 确定 性 的 行为 都 是 不 被 保证 的 。 使 用 命令 行 选 
项 ,仿真 器 可 以 以 不 同 的 顺序 运行 进程 ， 这 样 用 户 可 以 检查 仿真 结果 是 否 与 进程 的 
执行 顺序 有 依赖 关系 。 但 对 于 真实 场景 中 的 复杂 模型 ， 只 能 对 已 知 的 非 确定 性 行为 
进行 建 模 。 

基于 通信 与 计算 的 分 离 ， 在 不 同 场 合 的 硬件 重用 实现 得 以 简化 。SystemC 提供 
了 通道 、 端 口 以 及 接口 作为 通信 的 抽象 组 件 。 这 种 机 制 被 称 为 事务 级 建 模 (Trans- 
action- level Modeling), HH Grétker 等 人 [Grötker et al. , 2002] 定义 。 
定义 :“ 事 务 级 建 模 是 对 从 功能 单元 或 通信 架构 的 实现 细节 中 分 离 出 的 模块 之 间 的 
通信 细节 数字 系统 的 高 层 模 型 化 方法 。 类 似 总 线 或 FIFO 这 样 的 通信 机 制 被 模型 化 
为 通道 ， 模 块 使 用 SystemC 接口 类 来 使 用 这 些 通道 。 通 道 模 型 对 低层 的 信息 交换 细 
节 进 行 了 封装 ， 事 务 请 求 需要 调用 通道 的 接口 函数 。 在 事务 级 更 注重 数据 传递 的 功 
能 : 传输 的 是 何 种 数据 、 它 的 起 点 与 终点 在 哪里 。 事 务 级 较 少 关注 数据 传输 的 具体 
实现 ， 即 数据 使 用 何 种 协议 进行 传输 。 这 样 的 机 制 使 系统 级 的 实现 更 加 容易 ， 例 
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如 ， 无需 对 连接 的 各 种 不 同 总 线 架 构 模 型 ( 均 支 持 通用 抽象 接口 ) 进行 重新 编码 ， 
使 用 通用 的 接口 即 可 实现 模块 之 间 的 交互 。” 

SystemC 有 可 能 取代 当前 基于 VHDL 的 设计 流程 ， 现 在 已 经 可 以 复 用 SystemC 
来 进行 硬件 综合 [Herrera et al. ，2003a] [ Herrera et al. ，2003b] ， 也 已 经 有 了 商 
业 化 的 产品 。 这 方面 的 方法 与 应 用 有 相关 专题 进行 讨论 [Müller et al. , 2003], 
SystemC 已 经 被 制定 为 IEEE 1666—2005 标准 [ Open SystemC Initiative，2005] 。 





2.7.3 Verilog 5 SystemVerilog 


Verilog 是 男 一 种 硬件 描述 语言 。 在 最 初 ， 它 只 被 少数 人 使 用 ， 而 后 它 被 规定 
为 IEEE 1364 标准 ， 即 IEEE 1364 一 1995 (1.0 版 本 ) 与 IEEE 1364 一 2001 (2.0 
WAS). Verilog 中 的 许多 特性 与 VHDL 非常 相似 : 整个 设计 是 用 相互 连接 的 实体 
结构 来 描述 的 ， 实 体 的 行为 也 可 以 被 进一步 描述 ， 进 程 用 于 描述 硬件 模块 的 并 发 
性 。 与 VHDL 一 样 ，Verilog 也 支持 位 向 量 (bitveetors) 与 时 间 单 位 。 在 某 些 领 
域 ，Verilog 并 不 如 VHDL 灵活 ， 也 缺少 许多 内 崩 的 特性 。 例 如 ， 标 准 的 Verilog 
并 不 支持 在 IEEE 1164 标准 中 定义 的 枚 举 类 型 。 标 准 的 IEEE 1364 支持 8 种 信号 
强度 的 多 值 逻 辑 ， 而 Verilog 支持 4 种 ，VHDL 对 多 值 逻辑 这 一 特性 的 支持 比 Ver- 
ilog 要 好 得 多 。Verilog 也 有 许多 对 晶体 管 级 描述 的 特性 ， 但 VHDL 更 加 灵活 。 例 
W, VHDL 可 以 允许 将 硬件 实体 例 化 为 循环 ， 这 就 可 以 用 于 某 些 结构 化 的 描述 ， 
如 可 以 在 不 手动 指定 n 个 加 法 器 及 其 连接 关系 的 前 提 下 来 定义 一 个 nbit 的 加 
法 器 。 

Verilog 与 VHDL 的 使 用 人 数 相当 ,但 VHDL 在 欧洲 使 用 得 更 加 广泛 ，Verilog 
在 美国 的 使 用 人 数 则 更 多 一 些 。 

Verilog 的 3. 0 版 本 与 3. 1 版 本 即 人 们 所 知 的 System Verilog， 它 包含 着 大 量 对 
Verilog 2. 0 的 扩展 ， 这 些 扩 展 包 括 [Accellera Inc. , 2003], ，[ Sutherland ，2003 ] ， 

1) 为 行为 建 模 新 增 了 语言 元 素 ; 

2) C 数据 类 型 ， 如 int, typedef 与 struct; 

3) 将 硬件 模块 之 间 的 连接 重新 定义 为 接口 ; 

4) 使 用 标准 方法 来 调用 C/C ++ 的 函数 ， 在 某 些 情况 下 也 可 以 在 C 中 调用 内 
RAY Verilog 函数 ; 

5) 在 描述 电路 设计 ( Circuit Under Design, CUD) 的 测试 环境 ( 称 为 Test- 
bench) ， 以 及 使 用 Testbench 来 对 CUD 进行 验证 的 仿真 方面 有 重大 特性 改进 ; 

6) 在 Testbench 中 使 用 的 来 自 面向 对 象 的 类 ; 

7) 创建 动态 进程 ; 

8) 标准 的 进程 间 通 信 与 同步 ， 包 括 信和 号 量 ; 

9) 自动 内 存 分 配 与 释放 ; 

10) 为 常规 验证 的 标准 化 接口 新 增 的 语言 特性 。 
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由 于 C 与 C++ 的 交互 能 力 ，Verilog 也 可 以 很 容易 地 与 SystemC 进行 交互 ， 这 
些 针对 仿真 、 常 规 设计 的 验证 以 及 与 SystemC 交互 特性 的 增强 ， 使 Verilog 更 容易 
为 人 接受 。 在 最 近 ，Verilog 与 SystemVerilog 已 经 合并 成 一 个 标准 ， 即 IEEE 1800— 
2009 [IEEE, 2009], 


2.7.4 SpecC 


SpecC 是 基于 在 嵌入 式 系统 建 模 中 计算 与 通信 严格 分 离 的 一 种 系统 级 描述 语言 
[Gajski et al. ，2000] 。 这 种 分 离 是 组 件 在 不 同上 下 文中 可 重用 的 前 提 ， 也 使 系统 
组 件 的 即 插 即 用 (plug-and-play) 成 为 可 能 。SpecC 将 系统 模型 化 为 层次 网 络 ， 网 
络 之 间 通 过 通道 来 完成 通信 行为 。SpecC 的 描述 符 包含 行为 (Behaviors) 、 通 道 
(Channels) O (Interfaces), 行为 包含 了 端口 、 实 例 化 的 本 地 组 件 、 私 有 变量 
与 函数 以 及 一 个 公共 main 函数 。 通 道 是 对 通信 功能 的 封装 ， 包 含 着 用 于 定义 通信 
协议 的 变量 与 函数 。 接 口 用 于 链接 行为 与 通道 ， 用 于 声明 在 通道 中 被 定义 的 通信 
协议 。 

SpecC 也 可 以 对 般 套 的 行为 进行 建 模 。 图 2.73 中 [Gajski et al. ，2000] ， 组 件 
B 就 包含 了 两 个 子 组 件 bl 与 b2。 
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图 2.73 SpecC 结构 化 例子 


图 2.73 中 的 子 组 件 bl 与 b2 之 间 通 过 整数 cl 以 及 通道 c2 进行 通信 。bil 与 b2 
是 SpecC 结构 化 层次 网 络 中 的 叶 节 点 ,使 用 关键 字 par ，bl 与 b2 同时 执行 。 图 
2. 73 所 示 的 结构 化 层次 网 络 可 以 使 用 如 下 的 SpecC 模型 来 描述 : 
interface L {void Write(int x); }; 
interface R {int Read(void); }; 
channel C implements L,R 
{int Data; bool Valid; 
void Write(int x) {Data=x; Valid=true; } 
int Read (void) 
{while (!Valid) waitfor (10); return (Data);} } 
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behavior B1(in int p1, L p2, in int p3) 

{void main (void) {/* ...*/ p2.Write(p1);} }; 

behavior B2 (out int p1, R p2, out int p3) 

{void main(void) {/*...*/ p3=p2.Read(); Vs 
behavior B(in int p1, out int p2) 

{intc1; Cc2; B1 b1(p1, c2, c1); B2 b2(c1, c2, p2); 
void main (void) 
{par {b1.main(); b2.main();}} 
hi 

在 通道 C 所 使 用 的 接口 协议 中 包含 了 读 、 写 操作 的 方法 ， 可 以 在 不 改变 B1 与 
B2 行为 的 情况 下 改变 这 些 方法 。 例 如 ， 通 信 可 以 是 位 串 行 (bit-serial) 或 并 行 
(Parallel) ， 都 不 会 影响 到 BI 与 B2。 这 一 特性 对 于 IP 的 可 重用 性 非常 重要 。 

在 SpecC 中 ， 为 了 简化 同时 包含 软件 与 硬件 组 件 的 设计 ， 它 的 语法 是 基于 与 
C++ 的 。 事 实 上 ，SpecC 模型 都 需要 先 转化 为 C ++ 才能 进行 仿真 。 

在 系统 规范 阶段 ，SpecC 通常 使 用 消息 传递 来 进行 通信 ， 它 基本 上 可 以 对 任何 
种 类 的 通信 进行 建 模 ， 但 其 仿真 的 实现 一 般 需 要 基于 非 分 布 式 的 系统 。SpecC 的 通 
信 模 型 对 SystemC 2. 0 中 的 通信 设计 起 到 了 极 大 的 借鉴 作用 。 





2.8 9 - 诺 依 曼 语 言 


顺序 执行 是 汉 ，… 诺 依 曼 语言 的 共同 特征 。 同 时 ， 这 类 语言 还 允许 几乎 无 限制 地 
对 全 局 变量 进行 访问 。 使 用 CFSM 与 计算 图 (Computational Graphs) 的 模型 化 设计 
非常 适合 嵌入 式 系统 的 设计 。 但 是 ， 标 准 冯 ' 诺 依 曼 语 言 的 使 用 仍然 很 广泛 ， 因 此 
不 能 忽略 这 种 语言 。 

KPN 与 加 以 适当 约束 的 冯 . 诺 依 曼 语言 之 间 的 差异 并 不 明显 。 对 于 KPN 的 每 
个 节点 ， 仍 然 有 不 少 顺序 执行 的 代码 。 对 于 KPN ， 甚 建 模 的 重点 在 节点 内 部 的 通 
信 与 执行 细节 上 是 不 相关 的 ， 因 此 仍然 保留 着 KPN 与 冯 : 诺 依 曼 语言 之 间 的 差异 。 
对 于 这 里 讲述 的 头 两 种 语言 ， 语 言 中 即 内 建 了 通信 和 机制， 对 于 其 他 语言 ， 主 要 集中 
在 其 通信 机 制 上 ， 并 且 可 以 选择 不 同 的 库 来 替换 通信 机 制 。 


2.8.1 CSP 





顺序 通信 进程 (CSP, Communicating Sequential Processes) [ Hoare, 1985] 是 
最 早 包 含 进程 间 通信 机 制 的 语言 之 一 ， 其 通信 是 基于 通道 的 。 
例子 : 
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process A process B 
vara var b 
a:=3; aM 
cla; -- 输出 至 通道 C c?b; -- 从 通道 C 输 入 
end; end; 


两 个 进程 都 将 等 待 其 他 进程 到 达 输 入 或 输出 状态 ， 这 可 以 看 作 基 于 rendez- 
vous, BH3E (Blocking) 或 同步 消息 传递 (Synchronous Message Passing) 。 

由 于 CPS 依赖 于 等 待 来 自 一 个 特定 通道 输入 的 保证 ， 如 Kahn 进程 网 络 (Kahn 
Process Networks) ， 因 此 它 是 确实 性 的 。 

CPS 为 OCCAM 语言 奠定 了 基础 ，OCCAM 语言 被 作为 Transputer [ Thiébaut, 
1995] 的 编程 语言 。 在 XS1 处 理 器 [XMOS Ltd. , 2010] 的 设计 中 ， 这 种 强调 通信 
通道 的 方式 又 被 重 拾 。 


2.8.2 ADA 


在 20 世纪 80 年 代 ， 美 国 国防 部 意识 到 如 果 不 对 军用 设备 中 的 软件 进行 强制 约 
束 ， 它 们 的 可 靠 性 与 可 维护 性 将 很 快 成 为 一 个 巨大 的 问题 。 因 此 ， 他 们 决定 所 有 的 
软件 都 必须 使 用 同一 种 实时 语言 来 进行 编写 ， 也 就 需要 规划 这 样 一 种 语言 。 

当时 并 没有 能 满足 国防 部 需要 的 这 样 一 种 语言 ， 因 此 他 们 决定 重新 进行 开发 。 
这 种 语言 最 终 基 于 PASCAL 语言 进行 编写 ， 被 称 为 ADA (以 Ada Lovelace 命名 ， 她 
被 认为 是 第 一 位 女性 程序 员 ) 。ADA ”95 [Kempe, 1995], [Burns and Wellings, 
2001] 是 原始 标准 的 面向 对 象 扩展 。 

ADA 的 一 个 有 趣 特性 是 它 允 许 在 进程 (在 ADA 中 被 称 为 任务 ) HREH 
声明 。 只 要 控制 传递 到 了 任务 的 作用 域 ， 则 它们 就 立即 开始 执行 。 

如 下 例 所 示 (根据 Burns 等 人 的 研究 [Burns and Wellings, 1990]) ; 


procedure example1 is 





task a; 

task b; 

task body a is 
-- a 的 局 部 声明 
begin 

-- a 的 状态 

end a; 

task body b is 
--b 的 局 部 声明 
begin 
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--b 的 状态 
end b; 
begin 
-- 任务 a 与 b 将 在 example1 的 第 1 个 状态 之 后 开始 运行 
-- example1 的 状态 
end; 

ADA 中 的 通信 是 另 一 个 重要 的 概念 。 它 基于 rendez-vous 范例 (rendez- vous 
Faradigm) 。 无 论 何 时 ， 只 要 两 个 任务 想 交 换 信息 ， 先 到 达 “ 会 合 点 (Meeting 
Point) ”的 任务 必须 等 待 另 一 个 任务 也 到 达 相 应 的 会 合 点 。 按 照 ADA 的 语言 ， 程 
序 (Procedures) 用 于 描述 通信 。 在 任务 中 被 调用 的 程序 必须 使 用 关键 字 entry 进行 
声明 。 

例如 [ Burns and Wellings, 1990] : 

task screen_out is 

entry call (val : character; x, y : integer); 

end screen_out; 

在 任务 screen_out 中 包含 着 一 个 名 为 call 的 程序 ， 它 可 以 在 其 他 进程 中 被 调 
用 。 其 他 任务 也 可 以 通过 在 程序 前 加 上 任务 名 前 缀 来 调用 此 程序 : 


screen_out.call(’Z’,10,20); 
调用 任务 需要 等 待 任务 到 达 一 个 控制 点 ， 在 控制 点 它 才 接收 其 他 任务 的 调用 。 
这 个 控制 点 使 用 了 关键 字 accept : 


task body screen_out is 
ie 
accept call (val : character; x, y : integer) do 
end call; 


end screen_out; 
显然 ， 任 务 screen_out 可 能 会 在 同一 时 间 等 待 多 次 调用 。ADA 的 select 状态 提 
供 了 解决 这 种 情形 的 功能 。 
例如 : 


task screen_output is 
entry call_ch(val:character; x, y: integer); 
entry call_int(z, x, y: integer); 
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end screen_out; 


task body screen_output is 


select 
accept call_ch... do... 
end call_ch; 

or 
accept call_int ... do .. 
end call_int; 


end select; 


在 这 个 例子 中 ,在 call_en 或 call_int 被 调用 之 前 ， 任 务 screen_out 都 将 处 于 等 
待 状态 。 

由 于 可 以 使 用 select 状态 ，ADA 并 不 是 确定 性 的 。ADA 曾经 一 度 在 西方 国家 
作为 军事 设备 上 使 用 的 首选 编程 语言 。 关 于 ADA 的 最 新 信息 可 以 从 相关 网 站 上 进 
行 查找 (如 [Kempe Software Capital Enterprises (KSCE) ，2010] ) 。 


2.8.3 Java 


对 于 Java 而 言 ， 其 通信 可 以 通过 加 载 不 同 的 软件 库 来 实现 ， 它 的 计算 是 严格 
顺序 执行 的 。 

Java 是 一 种 与 运行 平台 无 关 的 语言 。 只 要 机 器 上 有 Java 解释 器 可 以 将 程序 编 
译 生成 的 内 部 字 节 码 (Byte-code) 进行 解释 ， 则 Java 程序 就 可 以 运行 。 字 节 码 是 
一 种 紧凑 型 的 表达 ， 与 标准 的 二 进 制 机 器 码 相 比 ， 它 需要 更 少 的 内 存 存储 空间 。 显 
然 ， 对 于 内 存 空间 有 限 的 片上 系统 应 用 而 言 ，Java 的 这 种 特性 是 一 个 优点 。 

同时 ，Java 也 是 一 种 安全 机 制 较 高 的 语言 。C 或 者 C++ 语言 (如 使 用 指针 的 
算法 ) 中 一 些 潜在 的 危险 特性 在 Java 中 都 不 存在 。 因 此 ，Java WE TAR ABE 
语言 中 对 安全 性 的 要 求 。Java 也 支持 异常 处 理 ， 简 化 了 运行 时 的 错误 恢复 过 程 。 由 
于 Java 提供 了 自动 内 存 垃圾 回收 的 机 制 ， 因 此 它 不 会 因为 地 址 空间 的 重新 分 配 而 
导致 内 存 泄 露 。 这 种 特性 避免 了 某 些 必须 不 间断 的 运行 数 月 甚至 数 年 的 应 用 系统 的 
一 些 潜 在 问题 。 由 于 Java 包含 着 线程 ( 轻 量 级 的 进程 )， 它 同时 也 能 满足 并 发 性 的 
要 求 。 

此 外 ， 由 于 Java 支持 面向 对 象 的 特性 ， 它 的 开发 系统 提供 了 许多 功能 非常 强 
大 的 库 ， 因 此 Java 应 用 能 够 快速 得 到 实现 。 

但 是 ， 标 准 的 Java 并 不 是 针对 实时 骨 入 式 系统 而 设计 的 ， 这 也 使 得 它 缺 少 了 
许多 实时 般 和 人 式 系统 必需 的 特性 : 

1) Java 运行 库 (Run-time Libraries) 的 大 小 也 会 加 到 最 终 的 应 用 程序 大 小 之 
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中 ， 而 运行 库 可 能 会 非常 大 。 因 此 ， 只 有 那些 大 规模 的 应 用 才 会 从 应 用 本 身 的 紧凑 
型 规划 中 获 益 。 

2) 许多 嵌入 式 应 用 都 需要 直接 控制 某 些 0 设备 。 但 在 Java 中 出 于 安全 性 的 
考虑 ， 它 并 不 允许 对 O 设备 直接 控制 。 

3) Java 的 自动 垃圾 回收 也 需要 处 理 时 间 。 在 标准 Java 中 ， 何 时 进行 垃圾 回收 
是 不 能 预测 的 。 因 此 ， 也 就 很 难 估 计 最 差 执 行 时 间 ， 而 只 能 对 运行 时 的 状况 作 一 个 
保守 估计 。 

4) 如 果 多 个 线程 都 准备 运行 ，Java 不 能 指定 各 个 线程 之 间 的 执行 顺序 。 因 
I, Java 环境 下 的 最 差 执行 时 间 更 加 难以 估算 。 

5) 相对 于 C 语言 ，Java 的 效率 更 差 。 因 此 对 于 系统 资源 受 限 的 系统 ， 并 不 推 
荐 使 用 Java. 

Nilsen [ Nilsen, 1998] 给 出 了 解决 这 些 问 题 的 方案 ， 如 硬件 支持 的 垃圾 收集 、 
蔡 换 Java 中 的 运行 调度 器 以 及 在 某 些 内 存 段 中 加 上 特定 标签 等 。 

当前 (2010 年 ) 流行 的 Java 编程 平台 有 Java 企业 版 (J2EE, Java Enterprise 
Edition) , Java 标准 版 (J2SE, Java Standard Edition), Java 微缩 版 (J2ME, Java 
Micro Edition) 以 及 CardJava [ Sun, 2010], CardJava 是 原 Java 的 一 个 子 集 ， 它 主 
要 应 用 在 强调 安全 性 的 智能 卡 领域 。J2ME 是 智能 卡 以 外 所 有 内 人 式 系统 的 Java FE 
发 平台 。 在 J2ME 中 使 用 两 个 配置 库 : CDC 与 CLDC。 其 中 ，CLDC 主要 用 于 移动 
电话 ， 它 使 用 MIDP 1. 0/2. 0 作为 其 应 用 程序 编程 接口 ( Application Programming In- 
terface, API), CDC 一 般 用 于 电视 机 以 及 功能 更 加 强大 的 手机 。 当 前 关于 Java X 
时 性 编程 的 著作 作者 主要 有 Wellings [ Wellings, 2004], Dibble [ Dibble, 2008] 和 
Bruno [ Bruno and Bollella, 2009] 等 ， 同 时 还 有 [ Java Community Process, 2002 | 
43 [ Anonymous, 2010b] 等 网 站 。 


2.8.4 Pearl 5 Chill 


Pearl [ Deutsches Institut fiir Normung, 1997 | 主要 是 为 工业 控制 应 用 而 设计 的 。 
针对 控制 过 程 与 时 间 参 考 ， 它 包含 了 大 量 特 别 的 语言 元 素 。Pearl 需要 一 个 基本 的 
实时 操作 系统 作为 开发 基础 。Pearl 在 欧洲 的 许多 工业 控制 项 目 中 都 得 到 了 很 广泛 
的 应 用 。 基 于 共享 内 存 ，Pearl 支持 使 用 信号 量 进行 项 目 级 的 通信 。 

Chill [ Winkler, 2002] 主要 用 于 电话 交换 站 ， 它 是 CCITT 的 标准 之 一 ， 在 电 
信 设 备 上 得 到 了 比较 广泛 的 应 用 。Chill 是 PASCAL 的 一 种 扩展 。 


2.8.5 通信 库 


标准 的 冯 “' 庄 依 曼 语言 并 没有 内 内 通 信 原 语 ， 但 是 它 允 许 以 函数 库 的 形式 添加 
通信 功能 。 这 些 函 数 库 在 支持 局 部 系统 通信 的 同时 ， 也 开始 支持 长 距离 通信 。 网 络 
协议 就 是 函数 库 中 的 例子 ， 它 已 经 得 到 了 越 来 越 广泛 的 使 用 。 在 本 书 讲述 系统 软件 
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的 章节 对 函数 库 还 作 了 进一步 的 介绍 。 
2.9 硬件 建 模 的 层次 


在 实践 中 ， 工 程 师 会 从 多 种 不 同 的 抽象 层次 来 开始 一 个 设计 周期 。 在 某 些 场 
景 ， 首 先 考 虑 的 是 系统 整体 行为 的 高 层 描述 ; 但 在 另 一 些 场景 ， 设 计 却 是 从 对 底层 
电路 规范 的 抽象 开始 。 对 于 设计 中 的 每 一 个 层次 ， 都 会 有 大 量 的 建 模 语 言 可 供 选 
择 。 在 下 面 的 部 分 ， 将 讨论 一 系列 可 能 的 建 模 层 次 。 出 于 本 书 内 容 的 考虑 ， 对 一 些 
较 底 层 的 描述 也 安排 在 了 此 处 ， 系 统 的 设计 不 应 该 从 这 些 底层 着 手 。 下 面 是 一 些 常 
用 建 模 层次 的 名 称 及 特征 : 

1) 系统 级 模型 (System Level Models); 系统 级 这 一 术语 的 定义 并 不 是 非常 清 
晰 。 在 此 处 它 表 示 的 是 整个 碟 入 式 系统 以 及 内 艇 了 信息 处 理 单元 的 系统 (“ 产 
品 ”) ， 同 时 它 可 能 还 包含 环境 特征 (系统 的 物理 量 输入 ， 如 轨道 、 天 气 情 况 等 ) 。 
很 显然 ， 对 于 这 样 包含 着 机 械 结构 与 信息 处 理 的 系统 级 模型 ， 很 难 找到 合适 的 仿真 
环境 。 可 能 解决 这 一 问题 的 方法 有 VHDL- AMS (VHDL 向 模拟 部 分 的 扩展 ) Sys- 
temC 或 者 MATLAB, MATLAB 与 VHDL- AMS 支持 对 偏 微分 方程 的 建 模 ， 这 是 对 机 
械 系 统 建 模 的 一 个 关键 特性 。 这 些 仿真 模型 同样 也 可 以 用 于 般 入 式 系 统 的 综合 ， 它 
还 可 以 对 系统 的 信息 处 理 部 分 进行 建 模 ， 但 这 已 经 是 比较 有 挑战 性 的 事情 了 。 如 果 
做 不 到 这 一 点 ， 则 可 能 需要 在 不 同 的 模型 之 间 进 行 转换 ， 而 这 种 转换 过 程 非常 容易 
出 错 。 

2) FER (Algorithmic Level); 在 这 一 层级 ,需要 对 将 在 租 和 人 式 系统 中 使 用 
的 算法 进行 仿真 。 例 如 ， 为 了 评估 最 终 的 视频 质量 ， 可 能 需要 提前 对 MPEG 视频 
编码 算法 进行 仿真 。 对 于 算法 仿真 ， 它 与 最 终 使 用 的 处 理 器 以 及 指令 集 无 关 。 

仿真 时 使 用 的 数据 类 型 也 许 会 比 最 终 使 用 的 数据 类 型 有 更 高 的 精度 。 例 如 ， 仿 
真 时 的 MPEG 使 用 双 精 度 浮 点 型 ， 而 最 终 的 谍 人 式 系统 很 难 也 使 用 这 样 的 精度 。 
如 果 在 仿真 时 使 用 的 bit 信息 能 与 最 终 实 现时 的 bit 信息 完全 对 应 ， 这 样 的 模型 就 被 
称 为 位 真 〈bit-true) 模型 。 将 非 位 真 模型 转换 为 位 真 模型 需要 工具 软件 的 支持 。 

这 一 层级 的 模型 可 能 会 包含 着 单个 处 理 器 或 一 系列 的 协 处 理 器 。 

3) 指令 集 级 (Instruction Set Level); 在 这 种 情况 下 ， 算 法 已 经 被 编译 成 了 所 
使 用 的 处 理 器 的 指令 。 在 这 一 层级 的 仿真 可 以 计算 出 所 执行 的 指令 数量 。 指 令 集 级 
有 许多 种 变异 : 

D 在 简化 的 模型 中 ， 通 常 只 对 指令 进行 功能 仿真 而 并 不 考虑 时 序 。 在 汇编 参 
考 手 册 [指令 集 架 构 (Tinstruction Set Architecture, ISA)] 的 信息 已 经 足够 用 于 定 
义 此 类 模型 。 

D 事务 级 建 模 : 在 事务 级 模型 中 ， 诸 如 总 线 读 写 、 不 同 模块 之 间 的 通信 等 事 
务 都 被 模型 化 ， 它 比 cycle- true 模型 (参考 下 文 ) 包含 的 细节 要 少 ， 它 更 强调 仿真 
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速度 [ Clouard et al. , 2003], 

O 在 更 精细 的 模型 中 ， 可 以 使 用 cycle- true 指令 集 仿真 。 在 这 种 场景 下 ， 可 以 
计算 出 运行 一 个 应 用 需要 的 精确 的 时 钟 周期 数 。 定 义 一 个 cycle- true 模型 需要 关于 
处 理 器 硬件 的 详细 信息 从 而 对 模型 进行 校正 ， 如 流水 线 阻 塞 、 资 源 限制 以 及 内 存 的 
等 待 延 时 等 。 

4) 寄存 器 传输 级 ( Register- Transfer Level, RTL): 在 这 一 层级 ， 在 寄存 器 传 
输 级 对 所 有 模块 进行 建 模 ， 包 含 算术 /逻辑 单元 ( Arithmetic/Logic Units, ALU), 
寄存 器 、 内 存 、 多 路 复 用 器 以 及 解码 器 。 这 一 层级 的 模型 通常 都 是 cycle-true 的 。 
根据 这 一 层级 的 模型 进行 自动 综合 并 不 是 很 大 的 挑战 。 

5) 门 级 模型 (Gate-level Models): 在 这 种 场景 下 ， 模 型 以 逻辑 门 作为 其 基本 
元 件 。 门 级 模型 描述 了 信号 跃迁 的 详细 信息 ， 因 此 它 可 以 用 于 系统 的 功 耗 估算 。 相 
HE RIL， 门 级 模型 也 可 以 得 到 更 为 精确 的 时 延 信 息 。 但 是 门 级 模型 不 包含 总 线 长 度 
以 及 容 抗 等 信息 ， 因 此 计算 出 的 功 耗 与 时 延 并 不 十 分 准确 。 

在 只 使 用 逻辑 门 来 表示 布尔 函数 的 一 些 场景 中 ， 也 常常 使 用 “ 门 级 模型 ”这 
一 术语 。 在 这 种 模型 中 的 逻辑 门 并 不 一 定 表示 的 是 真实 的 门 电路 ， 只 考虑 了 逻辑 门 
的 行为 ， 并 未 考虑 它们 是 否 表示 着 真实 的 物理 元 件 。 更 准确 地 讲 ， 这 样 的 模型 应 该 
被 称 为 “布尔 函数 模型 ( Boolean function models)”"S©， 但 这 一 术语 很 少 被 使 用 。 

6) 开关 级 模型 〈(Switch- level Models); 开关 级 模型 使 用 开关 (晶体管 ) 作为 
其 基本 器 件 ， 使 用 数字 量 模型 (参考 2.7. 1.5 节 关于 数字 量 的 描述 ) 。 与 门 级 模型 
相 比 ， 开 关 级 模型 更 适合 描述 信息 的 双向 传递 。 

7) 电路 级 模型 (Circuit-level Models) ; 电路 理论 及 其 元 器 件 (电流 源 、 电 压 
源 、 电 阻 、 电 容 、 电 感 以 及 半导体 的 宏 模型 ) 组 成 了 这 一 层级 的 仿真 基础 。 这 里 
的 仿真 还 包含 着 偏 微分 方程 ， 只 有 当 且 仅 当 半导体 电子 的 行为 是 线性 的 〈 或 接近 
线性 ) ， 这 些 公式 才 是 线性 的 。 这 一 层级 下 使 用 最 多 的 仿真 器 是 SPICE [ Vlad- 
imirescu, 1987] 及 其 变异 方法 。 

8) 布局 模型 (Layout Models): 布局 模型 反映 了 真实 电路 的 布局 ， 它 包含 着 电 
路 的 几何 (Geometric) 信息 。 因 为 几何 信息 并 不 能 直接 提供 与 电路 行为 相关 的 信 
县 ， 因 此 布局 模型 不 能 被 直接 仿真 。 可 以 从 布局 模型 与 较 高 层次 的 行为 描述 中 ,或 
从 布局 中 对 电路 进行 分 解 ， 又 或 者 使 用 这 一 层级 中 与 电路 元 件 相关 的 知识 来 对 电路 
行为 进行 推演 。 在 典型 的 设计 流程 中 ， 总 线 长 度 与 相应 的 容 抗 都 是 从 布局 分 解 得 知 
的 ， 这些 信息 而 后 又 作为 反 标注 (Back- annotated) 添加 到 较 高 层次 的 描述 中 。 这 
样 ， 关 于 系统 时 延 与 功 耗 的 估算 就 能 更 加 准确 。 

9) 器 件 与 工艺 模型 (Process and Device Models ) : 在 更 低 的 层级 上 ， 还 可 以 














这些 模 型 可 以 使 用 二 元 决定 图 (Binary Decision Diagrams, BDD) 来 表示 [ Wegener, 2000] 。 
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对 工艺 流程 进行 仿真 。 使 用 这 些 模型 信息 ,还 可 以 计算 出 器 件 (晶体 管 ) 参数 
(增益 、 容 抗 等 ) 。 


2.10 计算 模型 的 比较 


2. 10.1 比较 的 标准 


计算 模型 可 以 通过 许多 标准 进行 比较 。 如 Stuijk [Stuijk, 2007] 与 MoC 可 以 按 
如 下 标准 进行 比较 : 

1) 易 表 达 性 (Expressiveness) 与 简洁 性 (Succinctness) 分 别 说 明了 哪 类 系统 
可 以 被 模型 化 以 及 它 能 达到 怎样 的 紧凑 度 。 

2) 与 调度 算法 的 可 用 性 以 及 运行 时 支持 的 需求 相关 的 可 分 析 性 (Analyzability) 。 

3) 实现 效率 (Implementation Efficiency) 受 所 需要 的 调度 策略 以 及 代码 大 小 
的 影响 。 

图 2. 74 根据 以 上 这 些 标准 对 数据 流 模 型 进行 了 分 类 。 

Al 2.74 反映 了 Kahn 处 理 网 络 
的 易 表达 性 : Kahn 处 理 网 络 是 图 
RTE 4 HY (Turing- complete), ， 也 
就 是 说 任何 可 以 使 用 图 灵机 ( Tur- 
ing Machine) 来 完成 计算 的 问题 ， 
同样 可 以 使 用 KPN 来 完成 计算 。 
图 灵机 通常 被 作为 通用 计算 的 标准 Gon 5 
模型 [ Herken, 1995 ], {H 是 ， 可 分 析 性 
KPN 的 终端 属性 与 缓冲 区 大 小 上 限 图 2. 74 ”数据 流 模型 的 比较 
一 般 不 容易 分 析 。 另 一 方面 ， 由 于 
SDF 图 不 能 对 控制 流 进行 建 模 ， 因 此 它 并 不 是 图 灵 完 全 的 ， 但 死 锁 (Deadlock) 与 
缓冲 区 大 小 上 限 却 比较 容易 进行 分 析 。 同 构 的 SDF (Homogeneous SDF，HSDF) 图 
(所 有 图 的 比率 相等 ) 更 不 易 表 达 ， 但 更 容易 分 析 。 

可 以 通过 所 支持 的 进程 类 型 来 对 MoC 进行 比较 : 

1) 进程 数量 (Number of Processes) 可 以 是 动态 (Dynamic) 或 静态 (Static) 
的 。 如 果 每 个 进程 都 已 经 对 应 可 以 完成 某 部 分 硬件 功能 ， 同 时 也 不 必 考 虑 “ 热 插 
I (hot- plugging)” (动态 地 改变 硬件 架构 , 则 使 用 静态 数量 的 进程 可 以 简化 实 
现 。 否 则 ， 系 统 就 需要 支持 动态 的 进程 创建 (与 结束 )。 

2) 进程 可 以 是 静态 嵌 套 (Nested) 或 在 同一 级 进行 声明 。 例 如 ， 状 态 图 允许 
嵌 套 的 进程 声明 ,但 SDL 却 不 允许 。 艇 套 这 一 方式 主要 是 源 于 封装 性 方面 的 考虑 。 

3) 有 多 种 不 同 的 进程 创建 (Process Creation) 方式 。 可 以 通过 在 源 代 码 中 声 










易 表 达 性 与 简洁 性 
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明 进 程 ， 通 常 使 用 fork 与 join 机 制 (如 UNIX 操作 系统 就 支持 此 类 方式 ) ， 或 者 明 
确 调 用 进程 创建 函数 。 一 一 一 一 

多 种 以 数据 流 为 基础 的 计算 模型 的 
易 表达 性 如 图 2.75 所 示 [ Basten, 
2008 ] 。 虚 线 表示 的 是 一 些 没有 在 本 书 
中 讨论 的 模型 ， 如 MoC。 

至 今 描述 的 所 有 MoC 与 语言 中 ， 没 
有 任何 一 种 能 完全 满足 能 入 式 系统 规范 
语言 的 要 求 。 图 2. 76 展示 了 一 些 语言 














y t | 
的 关键 特性 概要 。 图 2.75 数据 流 模型 的 易 表达 性 
er EN 
语言 行为 层次 mak 多 请 支持 异常 eie 
状态 图 + J + 
VHDL + + + - 
SpecCharts + - + + 
SDL +- + +- = ap 
Petri nets - = = F 
Java + + + + 
SpecC + + + + + 
SystemC + + + + + 
ADA + - + + + 











图 2.76 语言 对 比 


有 意思 的 是 ，SpecC 与 SystemC 在 图 2. 76 中 满足 了 列 出 的 所 有 需求 。 但 是 事实 
上 有 许多 其 他 需要 并 没有 在 图 2. 76 中 列 出 (如 关于 deadlines 的 精确 划分 等 )。 由 
于 某 些 需求 在 本 质 上 就 是 有 冲突 的 ， 因 此 单一 的 MoC 或 语言 基本 上 不 可 能 完全 满 
足 所 有 需求 。 对 于 低 约束 的 实时 需求 ， 如 果 使 用 支持 硬 实时 要 求 的 语言 会 非常 不 方 
便 ; 同样 ， 适 合 分 布 式 控制 应 用 领域 的 语言 可 能 并 不 适合 以 分 立 数据 流 为 主 的 应 
用 。 因 此 ， 许 多 时 候 都 要 折 中 地 进行 选择 ， 或 者 使 用 多 种 模型 。 

那么 ， 在 实践 中 应 该 使 用 怎样 的 折 中 方案 呢 ? 在 实践 中 ， 早 期 的 嵌入 式 系统 纺 
程 通常 都 使 用 汇编 语言 编程 ， 它 的 程序 规模 一 般 都 比较 小 。 而 后 主要 是 使 用 C C 
的 派生 语言 。 由 于 艇 入 式 系 统 软件 复杂 度 不 断 增长 ， 在 C 语言 之 后 引入 了 高 层 语 
言 。 面 向 对 象 的 语言 与 SDL 都 提供 了 下 一 等 级 的 抽象 ， 类 似 于 UML 的 语言 都 需要 
在 设计 早期 获取 设计 规范 。 在 实践 中 ， 可 以 按 图 2. 77 使 用 这 些 语言 。 

根据 图 2. 77， 类 似 于 SDL 或 状态 图 的 语言 可 以 被 转化 为 C 语言 而 后 编译 。 如 
RAM SDL 或 状态 图 到 VHDL 的 转换 器 ， 则 它们 可 以 实现 硬件 上 的 功能 。C 与 
VHDL 作为 中 间 语 言 已 经 被 使 用 了 很 长 时 间 。 得 益 于 向 汇编 语言 转换 的 良好 机 制 ， 
Java 并 不 需要 中 间 步 又。 类 似 地 ， 各 种 图 之 间 的 转换 是 非常 灵活 的 。 如 SDF 图 可 
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图 2.77 组 合 使 用 多 种 语言 









































以 很 容易 地 转换 为 Petri 网 [Stuijk, 2007] 的 一 个 子 类 ， 同 样 ， 它 也 可 以 与 Karp 
与 Miller [ Karp and Miller, 1966 ] 发 起 的 计算 图 模型 (Computation Graph Model) 
子 类 相对 应 。 在 将 各 种 计算 模型 联系 起 来 的 过 程 中 ， 富 有 条 理 的 规范 与 技术 起 到 了 


积极 的 推动 作用 [Chen et al. , 2007], 
M. Radetzki [ Radetzki, 2009] WZ PELE TFA RRL 设计 的 多 种 语 
言 。Popovici 等 人 [Popovici et al. , 2010 | 将 Simulink 与 SystemC 进行 了 组 合 运用 。 


2.10.2 UML 


UML ”包含 的 图 可 反映 多 种 MoC 模型 。 图 2.78 根据 MoC 的 一 些 特点 对 当前 已 
经 提 及 的 UML 图 进行 分 类 。 






































通信 组 件 共享 内 存 rab 2 H 
T 用 例 
有 限 状态 机 状态 图 |- | - 
数据 流 | ORD 数据 流 图 
Petri 网 | (不 使 用 ) 活动 图 
分 布 式 事件 模型 - | = 
m HK BR aie - | 








图 2.78 UML 中 可 用 的 计算 模型 


图 2.78 展示 了 在 早期 的 设计 阶段 ，UML 如 何 覆盖 多 种 计算 模型 。 通 常 ， 对 通 
信 语 义 的 定义 都 并 不 精确 ， 从 这 个 角度 考虑 ， 关 于 UML 的 分 类 也 无 法 非常 精确 。 
基于 以 上 提 到 的 各 种 图 ， 有 以 下 8 类 图 可 用 于 建 模 : 

1) 部 署 图 (Deployment Diagrams); 此 类 图 对 于 内 人 式 系统 是 非常 重要 的 ， 它 
们 描述 了 系统 的 “运行 时 结构 ” (硬件 或 软件 节点 ) 。 
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2) 包 图 (Package Diagrams); 包 图 将 软件 分 割 成 软件 包 ， 它 们 与 状态 机 中 的 
模块 图 非常 类 似 。 

3) 类 图 (Class Diagrams) ; 类 图 描述 了 对 象 类 之 间 的 继承 关系 。 

4) 通信 图 (Communication Diagrams) [在 UML 1. x 中 也 被 称 为 协作 图 (Col- 
laboration Diagrams) ] : 通信 图 表达 了 类 与 类 之 间 的 关系 以 及 它们 之 间 交 互 的 消息 。 

5) 构件 图 (Component Diagrams); 构件 图 描述 了 在 应 用 或 系统 中 使 用 的 
构件 。 

6) 对 象 图 (Object Diagrams) 、 交 互 概 图 (Interaction Overview Diagrams) 、 
复合 结构 图 (Composite Structure Diagrams): 这 3 种 类 型 的 图 都 很 少 使 用 ， 它 们 有 
些 其 实 是 其 他 图 的 特定 类 型 。 

许多 工具 都 提供 了 对 多 种 不 同类 型 图 的 一 致 性 检查 功能 。 由 于 UML 的 语义 在 
最 初 就 没有 清晰 的 定义 ， 因 此 要 做 到 完整 的 一 致 性 检查 基本 上 不 太 可 能 。 它 是 否 是 
UML 创始 者 的 本 意 ， 这 是 一 个 有 争议 的 话题 ， 它 也 许 是 出 于 希望 设计 者 在 最 初始 
设计 阶段 不 要 过 多 地 考虑 精确 的 语义 的 目的 。 因 此 ， 只 有 在 UML 与 其 他 一 些 可 执 
行 语言 组 合 时 ， 才 能 从 中 得 到 精确 的 、 可 执行 的 规范 。 有 一 些 工 具 已 经 将 UML 与 
SDL [IBM, 2009] 和 C++ 结合 了 起 来 。 事 实 上 ， 有 许多 人 也 会 尝试 在 设计 初期 
去 定义 UML 的 语义 。 

1.4 版 本 的 UML IFA EP TRA RAMI, ALE RESMARA 
统 建 模 的 特性 。 典 型 地 ， 它 缺少 如 下 特性 [McLaughlin and Moore, 1998] ; 

1) 从 软件 中 划分 的 任务 与 进程 不 能 模型 化 ; 

2) 时 序 行为 完全 不 可 描述 ; 

3) 基本 的 硬件 模块 不 可 描述 。 

FFRKARAS PRE K EI K, ARAB UML 的 重要 性 也 有 所 提高 。 
针对 UML 在 支持 实时 应 用 领域 的 扩展 ， 许 多 学 者 都 提出 了 建议 [McLaughlin and 
Moore, 1998], ，[ Douglass，2000] 。 在 UML 2.0 版 本 中 已 经 进行 了 多 项 扩展 ， 它 包 
含 13 种 图 类 (UML 1.4 包含 9 种) [ Ambler, 2003], UML 的 概要 文件 也 考虑 了 实 
时 系统 的 需求 [Martin and Miller，2005 ] ，[ Miller，2007 ] ， 它 包含 了 带 约束 的 类 
图 、 图 示 、 符 号 以 及 一 些 (部 分 ) 语义 。 以 下 是 一 些 UML 概要 文件 Miller, 
2007]: 

1) 可 调度 性 、 性 能 与 时 间 规 范 (Schedulability, Performance and Time Specifi- 
cation, SPT) [ Object Management Group (OMG), 2005b]; 

2) 测试 [ Object Management Group (OMG), 2010a]; 

3) 服务 质量 (Quality of Service, QoS) 与 容错 [Object Management Group 
(OMG), 2010a]; 

4) 称 为 SysML 的 系统 建 模 语言 [Object Management Group (OMG), 2008 | ; 

5) 实时 舰 和 人 式 系统 的 建 模 与 分 析 (Modeling and Analysis of Real-Time Embed- 
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ded Systems, MARTE) [ Object Management Group (OMG), 2009]; 

6) UML +45 SystemC 的 互 操作 性 [ Riccobene et al. , 2005 | ; 

7) SPRINT 概要 文件 知识 产权 (Intellectual Property, IP) 的 可 重用 [Sprint 
Consortium, 2008 ] 。 

使 用 这 些 概要 文件 可 以 实现 许多 组 合 功能 ， 例 如 将 时 序 信 息 与 流程 图 结合 起 
来 。 但 概要 文件 有 可 能 是 不 兼容 的 。UML 是 为 建 模 而 开发 的 一 种 图 形 化 语言 ， 它 
又 留 下 了 大 量 的 开放 型 语义 问题 ， 这 些 问题 使 得 UML 可 以 在 实现 时 进行 自动 综合 
[ Müller, 2007], 


2.10.3 Ptolemy II 


Ptolemy 是 一 种 建 模仿 真 环境 ， 它 重点 用 于 异 构 系 统 的 建 模 、 仿 真 与 设计 。 针 
对 嵌入 式 系统 ， 则 主要 是 混合 了 多 种 技术 的 MoC。 例 如 ， 它 可 以 描述 模拟 与 数字 
电子 、 和 硬件 与 软件 、 电 子 与 机 械 设备 。Ptolemy 支持 多 种 不 同 的 应 用 领域 ， 如 信号 
处 理 、 控 制 工程 、 渐 进 决策 以 及 用 户 接口 等 。 尤 其 需要 注意 和 借入 式 软件 的 生成 ， 它 
主要 是 根据 适合 于 一 些 特定 领域 的 MoC 来 产生 软件 。Ptolemy 的 第 二 版 (Ptolemy ID) 
支持 如 下 MoC 及 其 相应 领域 : 

1) 通信 顺序 进程 (Communicating Sequential Processes, CSP) 。 

2) 连续 时 间 (Continuous Time, CT); 这 一 模型 适合 于 机 械 系 统 与 模拟 电路 。 
它 是 通过 对 一 系列 微分 方程 的 扩展 来 支持 这 一 领域 的 。 

3) 离散 事件 (Discrete Event, DE) 模型 : 许多 仿真 器 都 使 用 了 这 一 模型 ， 如 
VHDL 仿真 器 。 

4) 分 布 式 离散 事件 (Distributed Discrete Events, DDE): 由 于 后 续 事 件 采 用 单 
一 队列 ， 因 此 离散 事件 系统 往往 难以 进行 并 行 仿真 。 对 这 种 数据 结构 的 改变 至 今 没 
有 取得 很 好 的 成 果 ， 因 此 它 主要 针对 一 些 特 定 (实验 性 ) 的 领域 。 它 的 语义 定义 
使 其 分 布 式 仿真 比 在 DE 模型 中 有 更 高 的 效率 。 

5) 有 限 状 态 机 (Finite State Machines, FSM ) 。 

6) 进程 网 络 (Process Networks, PN): 使 用 Kahn 进程 网 络 。 

7) 同步 数据 流 (Synchronous DataFlow, SDF), 

8) 同步 /激励 (Synchronous/Reactive，SR) MoC: 这 种 模型 使 用 离散 时 间 
但 不 需要 在 每 个 时 钟 节拍 都 有 对 应 值 。Esterel 就 属于 这 类 建 模 语言 。 








2.11 思考 题 


1. 列 出 般 入 式 系统 规范 语言 至 少 6 个 需求 。 
2. 使 用 levi 仿真 软件 [Sirocic and Marwedel, 2007d] 对 巴黎 、 布 鲁 塞 尔 、 阿 
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姆 斯 特 丹 与 科隆 之 间 运 行 的 列车 进行 仿真 。 修 改 软件 中 的 例子 ， 从 而 使 任意 两 个 站 
所 之 间 有 两 条 独立 的 轨道 ， 并 且 展 示 出 含 10 辆 列车 的 一 种 (仲裁) 调度 方案 。 
3. 假定 给 出 了 图 2.79 所 示 的 状态 图 。 














图 2.79 状态 图 的 例子 


另外 ， 假 定 输入 事件 的 顺序 为 : 5c fh g he a bc。 在 图 2. 80 所 示 的 表 中 ， 标 
识 出 加 上 特定 输入 后 状态 图 所 处 的 状态 。 注 意 ， 妃 表示 了 历史 机 制 。 
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图 2.80 状态 图 的 状态 示例 


4. 请 解释 : 如 果 状 态 图 遵从 StateMate 的 语义 ， 它 是 确定 性 的 吗 ? 

5. 本 书 中 讨论 了 哪 3 种 类 型 的 Petri 网 ? 

6. Petri 网 中 的 某 一 类 允许 每 个 库 所 有 多 个 非 确定 性 的 令 牌 ， 这 一 类 网 络 的 数 
学 模型 中 使 用 了 哪些 组 件 ? 提示 : N= (已 ，…) 。 

7. 哲学 家 就 餐 问 题 的 紧凑 模型 跟 什 么 比较 类 似 ? 

8. CSA 理论 会 有 2、3 或 4 个 逻辑 强度 ， 相 应 于 4、7 和 10 这 些 逻 辑 值 。 在 
IEEE 1164 中 使 用 了 多 少 种 强度 与 数值 ? 

请 以 表格 的 形式 列 出 IEEE 1164 值 的 半 序 。 确 定 IEEE 1164 的 哪些 值 不 在 此 半 
序 范 围 中 ， 以 及 这 些 值 的 意义 是 什么 。 

9. 哪 一 种 电路 可 以 使 用 IEEE 1164 进行 建 模 : 互补 CMOS 输出 、 带 耗 尽 型 晶 
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体 管 的 输出 、 开 集 电极 输出 、 三 态 输出 、 总 线 预 充电 (如 果 同 时 使 用 耗 尽 型 晶体 
管 )。 


10. 假定 给 出 图 2. 81 所 示 的 总 线 。 包 含 & 符号 的 矩形 表示 与 门 。 
































图 2.81 三 态 输出 驱动 的 总 线 


如 果 两 个 输入 使 能 都 置 为 "0”( 即 enal = ena2 = '0')， 总 线 上 将 会 有 哪些 
IEEE 1164 的 值 ? 如 果 enal = °0’, ena2 = °1’, Hf2 = ，1’， 则 总 线 上 又 会 有 
哪些 IEEE 1164 的 值 ? 

11. 使 用 levi 仿真 软件 [ Sirocic and Marwedel ，2007b ] ， 仿 真一 个 用 以 计算 斐 
WAR] (Fibonacci Numbers) 的 Kahn 处 理 网 络 。 

12. 下 列 哪 一 种 语言 使 用 异步 消息 传递 通信 机 制 : 状态 图 、SDL、VHDL、 
CSP、Petri 网 。 

13. 下 列 哪 一 种 语言 使 用 广播 机 制 来 更 新 变量 : 状态 图 、SDL、Petri 网 。 

14. UML 支持 下 列 哪 种 图 : 顺序 图 、 记 录 图 、Y 图 、 用 例 、 活 动 图 、 电 路 图 。 


第 3 童 嵌入 式 系统 硬件 


3.1 简介 


在 租 入 式 信 息 一 物理 系统 的 设计 中 ， 需 要 对 硬件 与 软件 进行 综合 考量 ， 这 也 是 
它 的 一 个 重要 特点 。 在 基于 平台 的 设计 理念 中 ， 对 硬件 与 软件 模块 的 选择 是 其 核 
心 。 图 3.1 中 的 设计 流程 信息 ， 相 应 地 展示 了 对 可 用 硬件 模块 的 需求 ， 而 在 接 下 来 
的 内 容 中 ， 将 对 藤 入 式 系统 硬件 的 本 质 进 行 曾 述 。 
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图 3.1 简单 的 设计 流程 


与 个 人 电脑 中 的 标准 化 硬件 不 同 ， 艇 人 式 系统 的 硬件 多 种 多 样 。 对 于 如 此 庞大 
的 硬件 种 类 ， 很 难 对 所 有 硬件 类 型 都 进行 一 个 全 面 的 描述 ， 不 过 将 对 在 大 部 分 系统 
中 具有 共性 的 特征 模块 进行 概述 。 
















在 很 多 的 信息 一 物理 系统 ， rR 显示 
尤其 是 控制 系统 中 ， 硬 件 一 般 都 采样 保持 。 | “| ”信息 处 理 
工作 在 回路 状态 ( 见 图 3.2)。 e 

在 这 个 控制 回路 中 ， 传 感 rial te WT 












器 首先 对 物理 环境 中 的 信息 进 
行 采 集 。 通 常 ， 传 感 器 的 输出 
都 是 连续 的 模拟 量 。 在 本 书 
中 ， 规 定 信息 都 必须 以 离散 数字 量 的 形式 进行 处 理 。 从 连续 模拟 量 到 离散 数字 量 包 
转换 ， 通 常 由 两 种 电路 完成 : 采样 保持 电路 与 模 - 数 (A-D) 转换 电路 。 经 过 这 些 
转换 后 ， 信 息 就 可 以 以 数字 量 的 形式 进行 处 理 了 。 这 时 的 处 理 结果 可 以 在 显示 设备 
上 进行 呈现 ， 执 行 器 也 可 以 利用 它们 来 对 实际 的 物理 量 进行 相应 控制 。 大 部 分 的 执 
行 絮 都 是 模拟 的 ， 因 此 有 必要 将 数字 量 再 转换 为 模拟 量 。 





图 3.2 硬件 回路 
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很 显然 ， 这 样 的 模型 很 适合 控制 类 的 应 用 。 对 于 其 他 一 些 应 用 ， 它 也 可 以 用 于 
初期 的 评估 参考 。 接 下 来 ， 将 根据 图 3. 2 中 的 结构 ， 对 信息 一 物理 系统 中 硬件 模块 
的 本 质 特 征 进行 描述 。 


3.2 输入 
3.2.1 传感器 


现在 ， 将 开始 对 传感器 进行 详细 讨论 。 对 于 现 有 的 物理 量 ， 基 本 上 都 有 可 对 其 
进行 测量 的 传感器 ， 如 质量 、 速 率 、 加 速度 、 电 流 、 电 压 、 温 度 等 。 传 感 器 理论 
[Elsevier B. V. ，2010a] 描述 了 很 多 物理 影响 与 传感器 关系 ， 这 样 的 例子 如 电磁 感 
应 (在 变换 的 电场 中 产生 电压 )， 光电 效应 等 。 对 于 某 些 化 学 反应 ， 也 存在 相应 的 
传 感 人 [Elsevier B. V. , 2010b], 

最 近 几 年 间 ， 有 大 量 新 型 的 传感器 设计 产生 ， 这 其 中 大 部 分 都 得 益 于 智能 系统 
的 发 展 ， 它 们 为 现代 传感器 技术 起 到 了 重要 的 推动 作用 。 我 们 的 讲述 不 可 能 完全 覆 
盖 物 理 信息 系统 技术 ， 只 能 列举 一 些 关键 的 技术 要 点 作为 例子 : 

1) 加 速度 传感器 : 图 3.3 展示 了 基于 微 
系统 技术 制造 的 一 种 小 型 加 速度 传感器 。 传 感 
天 中 心包 含 一 个 很 小 的 质量 块 ， 当 传感器 加 速 
运动 时 ， 质 量 块 的 位 置 发 生变 化 ， 从 而 导致 与 
它 保持 连接 的 导线 电阻 值 发 生变 化 。 

2) 雨量 传感器 : 为 了 减少 对 驾驶 员 的 干 
扰 ， 一 些 汽车 装备 了 雨量 传感器 ， 刊 水 器 可 以 
根据 雨量 的 大 小 进行 自动 调节 。 EENE RTE 

3) 图 像 传感器 : 当前 存在 两 种 基本 的 图 Bütgenbach, IMT, TU Braunschweig, 
像 传 感 器 : 电荷 耦合 器 件 (CCD) 45 CMOS 传 © TU Braunschweig， 德 国 ) 
感 器 。 在 这 两 种 传感器 中 ， 都 使 用 了 光 传感器 
阵列 。CMOS 传感器 阵列 的 架构 与 标准 内 存 相似 : 单个 像素 都 可 以 被 随机 寻 址 与 读 
Wo CMOS 传感器 使 用 CMOS 的 标准 集成 电路 [ Dierickx，2000 ] 。 正 是 因为 这 样 ， 
传感器 部 分 与 逻辑 电路 部 分 才能 被 集成 在 同一 块 芯 片上。 同时 有 -一些 预 处 理 的 工作 
也 可 以 在 传感器 芯片 上 完成 ， 这 被 称 为 智能 传感器 。CMOS 只 需要 单个 标准 电源 ， 
同时 它 的 对 外 接口 也 非常 简单 ， 因 此 基于 CMOS 的 传感器 往往 比较 便宜 

相对 于 CMOS 传感器 ，CCD 传感器 技术 在 光学 特性 上 做 了 更 多 的 优化 .在 
CCD 技术 中 ， 像 素 点 反映 了 电荷 的 变化 ， 所 有 像素 的 信号 丢 加 在 一 起 ， 最 终 形成 
了 整 幅 画 面 。 电 荷 连续 变化 时 也 向 CCD 标明 了 它们 在 面板 上 的 位 置 。 对 于 CCD 传 
感 器 ， 接 口 更 加 复杂 。 


智 
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这 里 没有 一 个 明确 的 标准 来 选择 最 合适 的 图 像 传感器 。 在 过 去 几 年 ，CMOS 传 
感 融 采集 的 图 像 质量 得 到 了 很 大 的 提升 。 使 用 CCD 或 CMOS， 均 可 以 得 到 一 样 的 
图 像 质 量 。 但 是 ，CMOS 传感器 通常 比 CCD 传感器 的 功 耗 要 大 。 因 此 ， 如 果 是 设 
计 低 功 耗 的 系统 ， 应 当 首先 考虑 使 用 CCD 传感器 。 而 如 果 更 多 地 考虑 成 本 因素 ， 
则 可 以 选用 CMOS 传感器 。 如 果 是 设计 智能 传感器 ， 则 首先 选择 CMOS 型 。 出 于 对 
低 功 耗 的 考虑 ， 有 实景 播放 功能 的 相机 ， 一 般 都 使 用 CMOS 传感器 [ Belbachir, 
2010 ] 。 对 于 其 他 相机 ， 可 能 需要 根据 实际 应 用 来 进行 选择 。 

4) 生物 传感器 : 由 于 对 移动 通信 及 移动 设备 更 高 安全 性 的 需求 ， 生 物 认证 领 
域 保持 了 持续 增长 。 基 于 密码 验证 的 认证 方式 有 很 多 局 限 性 (如 被 瓷 或 密码 丢 
失 ) ， 因 此 智能 卡 、 生 物 传感器 及 生物 认证 在 近年 得 到 了 较 多 的 关注 。 生 物 认证 主 
要 是 对 用 户 的 当前 身份 的 真实 性 进行 验证 ， 这 些 验 证 方式 一 般 有 虹膜 识别 、 指 纹 识 
别 以 及 面部 识别 等 。 指 纹 传感器 一 般 使 用 与 集成 电路 制造 一 样 的 CMOS 技术 
| Weste et al. ，2000] 。 如 在 笔记 本 电脑 上 验证 用 户 的 指纹 ， 只 有 验证 通过 的 合法 
用 户 ， 才 能 使 用 系统 [IBM，2002]。 上 面 描述 的 CCD 与 CMOS 传感器 都 可 以 用 于 
面部 识别 。 在 生物 认证 中 ， 也 存在 认 假 率 与 拒 真 率 的 问题 ， 它 不 可 能 做 到 像 密码 那 
样 完全 匹配 。 

5) ATR: 近年 来 ， 人 工 眼 得 到 了 诸多 关注 ， 一 些 项 目 希望 它 能 对 视觉 产生 
影响 ， 一 些 项 目 则 希望 它 能 提供 一 种 间接 的 成 像 功 能 。 

如 Dobelle 研究 所 将 微型 摄像 机 安置 在 眼镜 上 ， 摄 像 机 收集 的 信和 号 被 计算 机 处 
理 并 转化 为 电子 脉冲 。 通 过 与 人 体 直接 相连 的 电极 ， 这 些 脉冲 信息 被 直接 送信 大 
脑 。 大 脑 所 感应 到 的 分 辩 率 大 约 是 128 x 128 像素 ， 它 足以 使 育 人 可 以 在 某 些 受 控 
区 域 驾驶 汽车 [The Dobelle Institute, 2003 ] 。 

最 近 ， 将 图 像 转化 为 声音 的 技术 与 有 了 突破 ， 显 然 ， 它 对 人 体 具 有 更 小 的 人 
侵 性 。 

6) 无 线 射频 识别 (RFID): 无 线 射频 识别 是 基于 智能 标签 对 无 线 射 频 信 和 号 进 
行 反馈 [Hunt et al. ，2007]。 智 能 标签 由 集成 电路 与 天 线 组 成 ， 它 向 RFID 阅读 器 
发 送 其 自身 的 身份 信息 。 智 能 标签 与 阅读 器 之 间 的 最 大 距离 ， 取 决 于 智能 标签 的 类 
型 。 这 种 技术 可 以 应 用 在 多 种 目标 上 ， 人 或 者 动物 也 可 以 被 识别 。 

7) 其 他 传感器 : 其 他 一 些 传感器 包括 : 压力 传感器 、 接 近 传感器 、 发 动机 控 
制 传感器 、 霍 尔 传感器 等 。 

传感器 都 会 产生 信和 号， 以 数学 化 的 形式 可 以 如 下 定义 : 

EX: 信号 o 是 从 时 域 Di 到 数值 Dv 的 映射 : 
a: D,—D, 

信号 在 时 域 可 以 是 连续 或 者 离散 的 ， 同 样 它 在 数值 上 也 可 以 是 连续 或 者 离 

散 的 。 
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3.2.2 离散 系统 : 采样 保持 电路 


当前 所 有 的 数字 计算 机 都 是 在 离散 的 时 域 Di 中 工作 的 ， 它 们 只 能 处 理 离散 序 
列 或 是 数值 流 。 因 此 ， 连 续 的 时 域 信号 必须 先 转化 为 离散 时 域 信号 ， 这 就 是 使 用 采 
样 保持 电路 的 目的 。 图 3. 4 左 图 展示 了 一 个 简单 的 采样 保持 电路 。 


e(t) an h(t) Dy e(t) ， 


时 钟 











图 3.4 采样 保持 电路 


图 3. 4 中 的 电路 包含 了 一 个 受 时 钟 驱动 的 晶体 管 以 及 电容 ， 唱 体 管 工作 在 开关 
状态 。 当 晶体 管 受 时 钟 的 驱动 而 置 为 导 通 状态 时 ， 电 容 充 电 ， 从 而 使 输入 电压 h(i) 
接近 输入 电压 c(t) 。 从 晶体 管 转 为 导 通 态 后 ， 直 到 晶体 管 再 次 关 断 ， 电 容 将 一 直 
处 于 充电 状态 。 电 容 两 端的 电压 值 可 以 看 作 来 自 连续 函数 e(:) 的 一 个 离散 值 序列 
A(t) 《〈 见 图 3.4 右 图 )。 如 果 在 [t] 内 的 各 个 时 间 点 上 对 el(t) 进行 采样 ， 则 有 (1) 
也 仪 在 这 些 时 间 点 上 有 意义 。 

对 于 理想 化 的 采样 保持 电路 ， 它 应 该 可 以 在 任意 短暂 的 时 间 内 改变 电容 两 侧 的 
电压 值 。 只 有 这 样 ， 输 出 序列 中 的 瞬时 电压 值 才 能 与 电容 两 端的 即时 输入 电压 相 匹 
配 。 在 实践 中 ,电容 都 有 一 个 较 短 的 时 间 窗 去 完成 真正 的 充 放 电 ， 其 电压 也 会 在 这 
个 时 间 窗 内 有 相应 的 变化 。 

有 趣 的 问题 是 : 可 以 从 采样 得 到 的 信号 h(t) 重 构 原始 信号 e0) 吗 ? 已 经 知 
道 ， 所 有 的 随机 信号 都 可 以 表示 为 多 个 正弦 函数 的 和 ， 这 些 正 弦 信 号 可 能 有 不 同 相 
位 《可 能 是 相位 移动 ) ， 或 者 不 同 频率 ( 傅 里 叶 分 解 )。 例如， 图 3.5 与 图 3.6 展 
示 了 在 不 同 正弦 波 频率 下 所 近似 出 的 方 波 ， 可 见 在 高 频率 的 正弦 波 时 ， 方 波 具 有 更 
好 的 平坦 度 。 











1.5 
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0.5 
0 
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图 3.5 使 用 K=1 (AA) SK=3 (AR) 的 正弦 波 来 近似 方 波 














O ”本 书 假定 在 做人 式 系统 课程 中 没有 关于 傅 里 叶 分 解 的 完整 理论 介绍 。 通 过 对 本 书 中 例子 的 分 析 ， 学 
生 应 该 可 以 更 好 地 理解 这 一 理论 。 
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图 3.6 使 用 K=7 (ARB) 与 K=11 (GA) 的 正弦 波 来 近似 方 波 


这 些 图 是 对 式 (3. 1) 的 图 形 化 表示 [Oppenheimet al. ，2009] ， 其 中 p 是 周期 : 


e'x(t) = 


> 


k=1,3,5,7,9-- 


以 标识 的 数据 处 理 被 认为 是 线性 的 (Linear) ， 对 于 信号 ei(1) Ge (t) 有 


Tr(e, +e,) =Ir(e,) +Tr(e,) 


in (22) 


(3.1) 


(3.2) 


现在 规定 ， 其 后 的 内 容 都 是 讲述 对 线性 系统 的 处 理 。 为 了 回答 前 面 提出 的 问 
题 ， 这 里 研究 对 正弦 波 独立 采样 的 影响 。 
假定 输入 信和 号 与 函数 e 或 e 对 应 : 


e(t) = sin( °F) +0. Ssin( “7 


27t 


e,(t) = sin( 全 +0. Ssin( 


8 


a] (3.3) 
=] +0. Ssin( #7") (3.4) 


函数 中 使 用 的 正弦 波 的 周期 分 别 为 p = 8. 4 和 1 [这 可 以 从 与 式 (3.1) 的 对 
比 中 看 出 ] 。 图 3. 7 所 示 是 对 这 些 函 数 的 图 形 化 表达 。 


假定 都 是 在 整 点 对 这 些 信号 进行 
采样 ， 则 任意 点 上 这 两 组 采样 值 将 相 
T. RER, 如果 只 有 这 一 组 采样 信 
号 ， 并 且 按 图 上 的 时 间 点 进行 采样 ， 
则 不 可 能 区 分 e( 切 与 es(t)。 通 常 ， 
对 于 变化 非常 缓慢 的 信号 e(t) 或 非 
常 迅速 的 信号 ea), WRIN AE 
采样 时 间 点 完全 相同 ， 则 不 可 能 区 分 
出 两 者 。 多 个 不 同 信号 经 采样 后 ， 如 
有 果 有 相同 的 采样 值 ， 称 为 混 释 。 事 实 
E, IRS e(t) 的 采样 频率 并 不 足 





2 


A e 

















TE a a 
图 3.7 Kte (t) (XR) 与 
e,(t) (虚线 ) 波形 


以 反应 它 的 变化 情况 ， 在 两 个 采样 点 之 间 ， 它 还 发 生 了 斜率 上 的 变化 。 从 这 个 反例 


可 知 ， 除 非 有 关于 频率 或 输入 信号 波形 的 其 他 信息 ， 


上 是 不 可 能 的 。 


否则 对 原始 信号 进行 重 构 基 本 


什么 样 的 采样 频率 才能 保证 采样 不 发 生 混 释 呢 ? 
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假定 以 固定 的 时 间 间 隔 来 对 输入 信号 进行 采样 ，p. 是 采样 周期 : 


Vsip, =t,,, -t, (3.5) 
4 y 
fer (3.6) 
Ps 


为 采样 速率 或 采样 频率 。 
根据 采样 理论 [Oppenheim et al. ，2009] ， 当 采样 频率 大 于 输入 信号 频率 的 两 
倍 时 ， 可 以 避免 混 香 : 


Py 
P: <5 (3:7) 


Ft, >2fy (3.8) 
式 中 PN 一 一 “最 快 ”正弦 波 的 周期 ; 
ho “BR” TERR TR 
定义 : fy BRAN yquist 频率 ，/ 是 采样 频率 。 
A (3.8) 即 采样 定理 ， 通 常 也 被 称 为 Nyquist 采样 定理 。 
因此 ， 只 有 确保 类 似 e) 一 样 的 高 频 信 号 从 输入 中 已 经 被 移 除 ， 才 可 能 从 离 
散 信号 h(t) 中 成 功 重 构 输入 信号 e(1) 。 这 也 就 是 抗 混 释 滤波 器 的 功能 。 
抗 混 共 滤 波 咒 一 般 放 置 在 采样 保持 电路 之 前 ( 见 图 3. 8)。 
图 3.9 展示 了 抗 混 和 滤波 器 对 输入 与 输出 信和 号 产生 的 影响 。 





| 理想 滤波 器 | 

| | 
| 

; 


























i 
| J /12 & + 
图 3.8 在 采样 保持 电路 之 前 的 图 3.9 ”理想 与 实际 的 抗 混 蚕 滤波 器 
抗 混 释 滤波 器 ( 低 通 滤波 器 ) 


理想 情况 下 ， 抗 混 秋 滤波 器 应 该 滤 除 二 分 之 一 采样 频率 以 上 的 所 有 频率 成 分 ， 
并 且 保 持 其 他 部 分 不 变 。 这 样 信号 e (+) 就 能 转变 成 信号 es(+) ， 但 这 样 的 滤波 器 
在 现实 中 并 不 存在 。 实 际 滤波 器 的 频率 在 小 于 人 /2 时 即 开始 衰 减 ， 并 且 它 不 能 消 
除 .人 /2 以 上 的 所 有 频率 成 分 ( 见 图 3. 9) 。 滤 波 也 会 对 高 频 成 分 进行 训 减 。 对 于 小 
于 /2 的 信号 ， 如 果 某 些 应 用 还 使 用 了 输入 信号 的 频率 参数 ， 可 能 引起 信号 “过 
冲 ”。 抗 混 释 滤波 器 的 设计 ， 本 身 就 是 一 门 艺术 。 





©” 为 了 与 调度 理论 中 的 标识 符 一 致 ， 使 用 p, 来 代替 7,。7, 在 数字 信号 处 理 中 非常 常用 。 
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3.2.3 数值 离散 化 : A-D 转换 器 


因为 已 经 约定 只 讨论 数字 计算 机 ， 因 此 需要 将 映射 在 连续 时 间 内 数值 域 D, 中 
的 值 ， 重 新 映射 到 离散 时 间 D', 内 。 将 模拟 量 转变 为 数字 量 的 工作 ， 即 由 模 - 数 
(A-D) 转换 带 完 成 的 。 有 许多 不 同 速度 /精度 的 A-D 转换 器 ， 在 本 书 只 讨论 两 种 
极端 情况 : 

1) Flash A-D 转换 器 : 这 种 类 型 的 转换 器 使 用 了 大 量 的 比较 器 。 每 个 比较 器 
有 两 个 输入 ， 分 别 记 为 + 与 - 。 如 果 在 + 端 输 入 的 电压 超过 了 - 端 输入 的 电压 ， 则 
产生 逻辑 `1” 和 输出， 否则 产生 逻辑 '0'9 。 

在 这 个 A-D 转换 器 中 ， 所 有 的 输入 都 接 到 一 个 分 压 器 ， 如 果 输 入 电压 Ai) 超 


MET [Vers SUPA 3. 10a 上 面 的 比较 器 将 产生 "1 。 比 较 器 输出 侧 的 译 码 器 将 把 它 作 


为 输出 值 中 最 高 位 的 '1' 。 由 于 V. 一 般 是 电源 电压 ， 因 此 应 当 尽 量 避 免 h(1) > 了。 
的 情况 ， 否 则 可 能 对 电路 造成 损坏 。 在 这 里 的 例子 中 ， 如 果 转 换 器 没有 因为 过 高 的 
输入 电压 而 损坏 ， 则 大 于 Vw 的 输入 电压 将 产生 最 大 的 数值 。 


Vref 
h(t) 














= 


SS 
K 











上 | 一 Bly Blw 








图 3.10 Flash A- D 转换 器 以 及 w 是 有 的 函数 
a) Flash A-D 转换 器 b) with MRR 
如 果 输入 信号 AO) 小 于 二 Js， 但 又 大 于 了 Yu， 图 3. 10 上 的 比较 器 将 产生 输 
出 0" ， 而 下 一 个 比较 器 仍然 是 '1' ， 编 码 器 将 把 这 个 值 作为 转换 结果 的 次 高 位 。 
对 于 于 Vr < AD < SV AO < h(t) < 二 Vi 的 情况 相似 编码 器 将 产生 相 


应 的 第 三 个 高 位 以 及 最 低位 。 图 3. 10b 展示 了 输入 电压 与 所 得 数值 的 关系 。 
比较 器 以 一 种 特定 的 方式 来 产生 输出 : 如 果 比 较 器 输出 '1” ， 则 它 后 面 的 所 有 








O ”在 实际 中 ， 讨 论 两 个 输入 完全 一 致 的 情况 的 意义 不 大 。 出 于 多 种 原因 (如 温度 、 制 造 流程 等 ) ， 这 两 
个 输入 端的 电压 总 是 会 有 微小 的 差异 。 
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输出 也 都 等 于 "1 7” 。 编 码 器 将 这 种 数值 表达 转换 为 常规 的 自然 数 。 此 处 的 编码 器 也 
党 被 称 为 “优先 级 编码 器 ”， 它 将 最 高 位 为 "1” 的 输入 数值 转化 为 二 进 制 数 9 。 

这 个 电路 可 以 将 正 模拟 输入 电压 转换 为 数值 ， 如 果 需 要 对 正 负 电压 同时 进行 转 
换 并 产生 互补 输出 ， 则 需要 对 电路 进行 扩展 。 

A-D 转换 器 的 重要 指标 之 一 是 其 分 辨 率 ， 它 有 多 个 不 同 但 仍然 相关 联 的 含义 
[ Analog Devices Inc. Eng. , 2004], A-D 转换 器 的 分 辩 率 是 A-D 转换 器 能 够 生成 的 转 
换 结果 的 位 数 。 例 如 ，16 位 分 状 率 的 A-D 转换 器 在 音频 领域 有 很 多 应 用 场景 。 分 辨 率 
也 可 以 以 电压 来 进行 量化 ， 此 时 它 表示 的 是 因 两 端 输 入 之 间 的 差 值 而 使 结果 增加 了 1: 

V 
0= paul 


式 中 sa 一 一 最 大 与 最 小 电压 的 差 值 ; 
@ 一 一 每 一 次 转换 的 电压 精度 ; 
电压 间隔 的 数量 〈 不 是 位 数 ) 。 
例如 ， 对 于 图 3. 10 中 的 A-D 转换 器 ,假定 Vw 是 最 大 电压， 其 分 状 率 是 2bit 


或 了 Vi 电压 。 


Flash A- D 转换 器 的 优点 在 于 其 转换 速度 较 快 ， 它 工作 时 不 会 消耗 太 多 的 时 钟 
周期 。 它 的 输入 与 输出 之 间 的 延 时 非常 小 ， 电 路 使 用 起 来 也 比较 容易 ， 这 样 的 特性 
使 其 很 适合 在 诸如 需要 高 速 转换 的 音频 领域 应 用 。Flash A-D 转换 器 的 缺点 在 于 其 
硬件 的 复杂 度 ， 对 于 n 个 数值 需要 进行 n -1 次 比较 才能 完全 区 分 。 如 果 用 此 类 
A-D 转 换 器 在 CD 唱片 机 上 产生 数字 音频 信号 ， 则 需要 2" - 1 个 比较 器 ! 所 以 ,高 
分 辨 率 的 A-D 转换 器 必须 基于 其 他 不 同 的 工作 方式 。 

2) 逐次 逼近 型 : 使 用 逐次 逼近 型 A-D 转换 器 可 以 实现 高 分 辩 率 的 数 一 模 转 
换 。 其 电路 参考 图 3. 11。 








n 





(1) 控制 逻辑 ] 
连续 逼近 寄存 器 | 








数字 输出 
w(t) 


= D-A 转 换 器 | 








图 3. 11 逐次 逼近 型 转换 电路 


逐次 逼近 型 的 关键 点 是 使 用 二 进 制 搜索 。 在 初始 阶段 ， 逐 次 逼近 型 输出 寄存 器 
最 高 位 被 设置 为 '1' ， 其 他 位 都 是 0" 。 寄 存 器 中 的 值 被 转换 为 一 个 模拟 量 ， 大 致 





O 这 样 的 编码 器 在 查找 浮 点 数 的 小 数 部 分 为 '1” 的 最 高 位 时 ， 也 非常 有 用 。 
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是 0.5 x 最 大 输入 电压 ?。 如 果 A(t) 大 于 当前 产生 的 模拟 量 ， 则 保持 寄存 器 的 最 
高 位 为 "1 ， 否 则 将 其 设置 为 "0， 。 

输出 寄存 器 下 一 个 位 值 总 是 与 前 一 步 的 处 理 相关 : 如 果 输 入 值 在 输入 范围 的 
1/4 ~1/2 之 间 ， 则 它 仍 然 为 "1" 。 相 同 的 处 理 一 直 重 复 ， 直 到 计算 出 所 有 的 输出 
位 。 图 3. 12 展示 了 这 样 的 例子 。 

在 图 3. 12 中 ,初始 状态 时 最 高 位 被 置 “了 
为 '1” ， 由 于 输出 的 结果 V_ 小 于 h(t)， 则 ] 
最 高 位 仍然 为 ' 1 。 而 后 次 高 位 也 被 置 为 yy Jat 
"1' ,但 由 于 结果 V_ 大 于 h(t), 这 一 位 被 J] mi 而 
重 置 为 '0' 。 接 下 来 再 对 第 三 个 高 位 进行 检 ”|， 
查 ， 如 此 重复 。 很 显然 ， 在 整个 转换 过 程 Ji 
P, A(t) 都 应 该 保持 不 变 。 对 于 这 样 的 需 J! 
求 ， 使 用 前 面 所 述 的 采样 保持 电路 即 可 实 
现 。 最 后 输出 的 数字 信号 标识 为 w(1) 。 图 3.12 EKDE 

逐次 到 近 型 的 显著 优点 是 其 硬件 效率 ， 
为 了 区 分 nn 个 数字 量 ， 逐次 逼近 型 转换 器 的 寄存 器 需要 log, (n) 个 位 ， 以 及 log, 
(n) 个 位 的 D- A 转换 器 。 它 的 缺点 在 于 速度 : 对 于 个 数字 量 的 转换 ， 它 的 算法 
等 级 为 O(log，(n) ) 。 因 此 ， 这 种 转换 器 适用 于 高 精度 中 等 速度 的 场合 。 

图 3. 13 强调 了 A-D 转换 器 的 行为 ， 在 这 里 ， 它 的 输入 信号 来 自 式 (3.3), 图 
3. 13 中 仅 展示 了 输入 信号 为 正 的 部 分 。 
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图 3.13 h(t) (虚线 )、 输 出 函数 w(1) (点 画 线 ) 和 
w(t) -h(t)( 实 线 ) 


图 3. 13 展示 了 量化 后 的 数值 以 及 其 相应 的 电压 值 ， 同 时 还 包含 这 两 者 之 间 的 








O ”庆幸 的 是 ， 从 数字 量 到 模拟 量 的 转换 (D-A 转换 ) 的 效率 非常 高 ， 转 换 速度 也 非常 快 。 


96 RAK KARRI 





嵌入 式 信息 物理 系统 基础 ( 原 书 第 2 版 ) 





差 值 。 很 显然 ， 转 换 器 在 将 模拟 信号 转换 为 可 用 的 数值 时 ,采取 了 “截断 ”操作 

(量化 数值 总 是 小 于 或 等 于 模拟 值 ) 。“ 截 断 ”是 产生 比较 结果 的 一 种 重要 方式 。 而 

“ 凑 整 ”操作 则 对 “ 半 个 位 ”的 情况 在 内 部 作 了 校正 操作 。 事 实 上 ， 数 字 信和 号 的 编 

码 值 是 原始 信号 与 w(t) Bh(t) 差 值 的 和 。 也 就 是 说 ， 这 两 个 信号 的 差 值 被 加 入 
到 了 原始 信号 中 ， 这 个 差 值 信号 被 称 为 量化 噪声 (Quantization Noise) : 

量化 噪声 (区 =w(t) - h(t) (3.9) 

1 量化 噪声 (上 ) | <Q (3. 10) 

很 显然 ， 可 以 通过 增加 A-D 转换 器 的 分 辩 率 来 降低 其 量化 噪声 。 量 化 噪声 对 
转换 器 的 影响 可 以 通过 信 品 比 〈Signal-to- Noise Ratio, SNR) 的 定义 来 进一步 解 
释 。SNR 的 度量 单位 是 分 贝 (1/10 Bel， 以 Alexander G. Bell 命名 ) ; 

言 号 功率 
SNR(dB) = 10log A E (3. 11) 
=20log AAA EEE (3.12) 

在 这 种 情况 下 ， 对 于 给 定 的 阻抗 R， 信 号 的 功 耗 是 电压 的 二 次 方 。dB 并 不 是 
一 个 物理 单位 ， 因 为 信 噪 比 并 不 是 量 纲 。 

对 于 给 定 的 信号 h(t) ， 量 化 噪声 的 功 耗 等 于 aQ， 其 中 根据 h(t1) 可 知 a<1。 
WRA) 总 是 可 以 使 用 一 个 数字 量 准 确 表 达 ， 则 w =0。 如 果 A(t) 总 是 比 下 一 个 
值 “ 仅 小 一 点 点 ”， 则 a 可 能 接近 1。 

举例 (OTF a~1), 16bit CD 音频 的 SNR 可 以 按 下 式 计算 : 

20log (2%) =96dB 

而 对 于 高 质量 的 24bit CD ， 可 以 得 到 大 约 为 144 dB 的 SNR。a<1 以 及 A-D 转 
换 本 身 的 误差 都 会 对 这 一 结果 有 影响 。 

也 有 许多 其 他 类 型 的 A-D 转换 器 ,它们 在 转换 速率 与 精度 上 均 不 一 样 
[0”Neill，2006]。 当 前 也 有 许多 自动 筛选 最 合适 的 转换 器 的 技术 [ Vogels and 
Gielen, 2003 | 。 

















3.3 ”处理 单元 


3.3.1 概述 


当前 所 有 的 能 入 式 系统 的 工作 都 必须 依赖 于 电能 ， 它 们 使 用 的 电能 总 和 通常 被 
称 为 “能 耗 ”。 严 格 来 讲 , “能 耗 ” 这 一 术语 并 不 正确 ， 因 为 电能 都 会 转化 成 为 其 
他 形式 的 能 量 ， 典 型 的 就 是 热能 。 对 于 嵌入 式 系统 ， 持 续 可 用 的 能 量 是 系统 工作 的 
关键 因素 。 这 一 点 其 实 早 有 认识 :“ 电 力 已 经 被 认为 是 舱 入 式 系统 的 最 大 限制 因素 
之 一 ”[ Eggermont，2002] 。 电 力 与 能 耗 的 重要 性 ， 在 嵌入 式 系统 的 早期 就 被 认识 
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到 了 。 在 近年 的 通用 计算 项 目 中 ， 能 耗 问题 得 到 了 更 多 关注 ， 也 产生 了 诸如 绿色 计 
(Green Computing Initiative) 之 类 的 新 概念 。 RTF RAR A BP fe AAD, 
考虑 使 用 硬 连 线 的 可 重用 ASIC 、 可 重 配 逻 辑 以 及 可 编程 序 处 理 器 。 从 能 耗 的 角度 
考虑 ， 这 3 种 技术 是 非常 不 同 的 。 图 3. 14 重复 了 图 1. 4。 
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图 3. 14 硬件 效率 (© De Man and Philips) 


图 3. 14 展示 了 当前 可 用 的 硬件 技术 中 能 耗 与 灵活 性 之 间 的 矛盾 : 如 果 设 计 目 
标 是 低能 耗 的 系统 ， 则 应 该 使 用 ASIC 去 蔡 代 基于 处 理 器 或 可 重 配 逻 辑 单元 ;如 果 
设计 目标 是 灵活 性 ， 则 显然 不 能 再 同时 得 到 低能 耗 。 
对 于 单 次 的 操作 ， 应 用 消耗 的 能 量 E 与 所 需 能 量 已 之 间 有 下 关系 : 
E= [Pac (3.13) 
假定 某 个 系统 所 消耗 的 电力 为 P0), ÆA to 个 单位 的 执行 时 间 后 ， 它 所 产 
生 的 能 量 消耗 为 
Ey = INAO! 
假定 系统 经 修改 后 ， 它 需要 t 的 时 间 完 成 相应 操作 ， 其 能 量 消 耗 为 P): 
E, = [Pica 
如 果 Py (1) EPG) 略 大 ， 则 减少 的 执行 时 间 同 样 会 减少 能 量 消耗 。 但 通常 
这 样 的 结论 并 不 正确 : 由 图 3. 15 可 见 ，E, 可 能 小 于 E, 但 E, 也 有 可 能 大 于 EE,。 
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降低 电力 与 能 量 的 消耗 都 PÀ 。 更 大 功率 ， 更 低 效率 ? 
非常 重要 。 电 力 消 耗 对 供电 模 Pd 
块 有 较 大 影响 ， 如 所 选择 的 电 
压 调整 器 、 布 线 的 复杂 度 以 及 
散热 装置 等 。 尤 其 是 在 移动 市 
场 领域 ， 对 低能 耗 有 着 苛刻 的 
要 求 ， 这 源 于 电池 技术 近年 来 
发 展 缓慢 [ITRS Organization, to 
2009], ， 同 时 能 源 的 价格 也 在 ”图 3.15 REEE, $ E, 的 比较 
不 断 上 涨 。 同 时 ， 低 能 耗 的 系 
统 也 会 减少 对 散热 设备 的 要 求 ， 它 的 稳定 性 也 更 好 (电子 元 器 件 在 高 温 环境 下 会 





一 








加 速 老化 ) 。 
下 面 首 先 来 考虑 一 下 ASIC (专用 集成 电路 ) 中 的 情况 。 
3.3.2 ASIC 


对 于 高 性 能 应 用 以 及 大 规模 市 场 ， 可 以 考虑 在 设计 中 使 用 ASIC。 但 ASIC 的 设 
计 与 制造 成 本 都 非常 高 晶 ， 如 将 光 刻 模型 转 成 芯片 的 掩 膜 工艺 ， 它 的 一 般 成 本 大 概 
是 10° ~ 10° 欧元 或 美元 ， 近 年 来 ， 掩 膜 工艺 的 成 本 更 是 以 指数 级 上 升 。 但 是 ， 这 
种 实现 也 有 着 开发 周期 长 、 缺 少 灵活 性 等 缺点 ; 纠正 设计 中 的 错误 一 般 需要 新 的 掩 
膜 ， 并 且 需 要 重新 加 工 制造 。 因 此 ，ASIC 只 有 适用 于 那些 对 能 耗 有 极其 萌 刻 场景 
或 者 市 场 能 接受 其 成 本 ， 又 或 者 系统 有 着 大 规模 的 应 用 市 场 。 鉴 于 它 的 应 用 范围 ， 
本 书 不 对 ASIC 作 过 多 讨论 。 


3.3.3 ”处理 器 


处 理 器 的 关键 优点 是 其 灵活 性 。 使 用 处 理 器 ， 就 可 以 通过 改变 系统 软件 来 改变 
伐 人 式 系统 的 所 有 行为 。 改 变 诸 入 式 系统 的 行为 可 能 有 多 种 原因 ， 如 修正 设计 中 的 
错误 、 更 新 系统 、 标 准 的 改变 ， 或 者 在 系统 中 增加 新 的 功能 。 正 是 因为 如 此 ， 处 理 
天 在 能 入 式 系统 中 的 应 用 越 来 越 广泛 。 

伐 入 式 系统 一 般 要 求 高 效率 ， 它 们 的 指令 不 需要 与 通用 的 个 人 计算 机 (PC) 3f 
容 。 因 此 ， 它 们 的 架构 可 能 与 PC 上 的 处 理 器 有 较 大 差异 。 能 耗 有 多 个 不 同 的 衡量 因素 ; 

1) BER (Energy-effciency) : 系统 的 架构 必须 要 考虑 如 何 来 提高 能 效 ， 而 在 
软件 设计 方面 也 要 考虑 如 何不 增加 额外 的 能 耗 。 举 个 例子 ， 如 果 因 为 编译 器 而 使 软 
件 产 生 了 50% 的 额外 开销 ， 为 了 仍然 能 满足 系统 的 运行 时 间 ， 可 能 会 增加 供电 电 
压 ， 或 者 系统 的 时 钟 频 率 ， 此 时 ， 系 统 与 ASIC 所 能 达到 的 能 耗 标 准 差异 就 更 大 ， 
可 能 远 不 止 50% 。 

有 多 种 可 行 的 技术 可 以 在 各 个 层面 去 提高 处 理 器 的 能 效 ， 从 软件 开发 到 芯片 的 
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制造 流程 [Burd and Brodersen，2003] ， 它 们 都 应 该 被 顾及 到 。 门 控 时 钟 就 是 这 些 
提高 能 效 的 技术 之 一 。 在 处 理 器 空闲 时 ， 处 理 器 的 部 分 模块 将 从 时 钟 源 断 开 。 例 如 
当 DMA (Direct Memory Access， 直 接 内 存 存 取 ) 或 总 线 桥接 器 空闲 时 ， 它 们 的 时 
钟 将 关闭 ， 同 时 也 尽量 减少 处 理 器 需要 的 时 钟 。 有 两 种 实现 方法 : 全 局 同步 但 局 部 
异步 型 处 理 器 ; 全 局 异步 但 局 部 同步 型 处 理 器 (GALS) [Iyer and Marculescu, 
2002]. #£ E. Macii [ Macii, 2004] 的 著作 以 及 PATMOS 会 议论 文中 (参见 
[ Monteiro and van Leuken，2010] ) ， 提 供 了 关于 低 功 耗 设 计 的 详细 技术 资料 。 

有 两 种 技术 可 以 用 于 较 高 层 的 抽象 实现 : 

D 动态 电源 管理 (Dynamic Power Management, DPM) : 基于 这 种 技术 ， 处 理 
器 有 多 个 省 电 状 态 而 不 是 一 直 处 于 标准 工作 模式 。 每 一 种 省 电 状 态 都 有 不 同 的 电力 
消耗 ， 并 且 转 换 到 正常 的 工作 模式 也 需要 不 同 的 转换 时 间 。 图 3. 16 展示 了 Strong- 
Arm SA 1100 处 理 器 的 3 个 状态 。 

在 运行 状态 ， 处 理 器 全 速 工作 ; 在 空闲 a 
状态 ， 处 理 器 仅 监听 中 断 输 入 ; 在 睡眠 状态 ， 
芯片 处 于 关 断 状态 ， 处 理 器 被 复位 ， 同 时 芯 
片 的 供电 也 被 关 断 [ Wolf, 2001], 。 使 用 独立 
的 WO 供电 使 系统 可 通过 硬件 来 对 电源 进行 
管理 ， 通 过 预 置 的 唤醒 事件 ， 电 源 管理 硬件 
也 可 以 对 处 理 器 进行 唤醒 操作 ， 使 处 理 器 再 图 3.16 StrongArm SA 1100 处 理 器 的 
次 进入 到 运行 状态 。 需 要 注意 的 是 ， 了 睡眠 状 POEWE [Berini ot al , 2000] 
态 与 其 他 状态 的 电源 消耗 有 很 大 差异 ， 从 睡 
眠 到 运行 状态 存在 较 大 的 延迟 。 

© 动态 电压 调整 (Dynamic Voltage Scaling, DVS); 这 种 方式 基于 CMOS 型 处 
理 带 的 能 耗 将 以 供电 电压 Vs 的 二 次 方 数 上 升 的 理论 。CMOS 电路 的 功 耗 由 下 式 决 
定 [Chandrakasan et al. , 1992]; 








90us 
50mW 160uW 


P =C, Vaf (3.14) 
式 中 a 一 一 活动 的 开关 数 ; 
Ci 一 一 负载 电容 ; 
也, 一 一 供电 电压 ; 
/一 一 时 钟 频 率 。 
CMOS 电路 的 延迟 可 以 按 下 式 估计 [ Chandrakasan et al. , 1992], [ Chandrakasan 
et al. ，1995 | : 
Vaa 


=kC; 一 一 一 一 一 (3.15) 
(Via - V.)? 


T 


式 中 4 一 常量 ， 
8 一 一 门限 电压 ， 只 影响 着 晶体 管 所 需 的 开启 电压 。 
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假定 最 大 供电 电压 Vu 3. 3V, V, 是 0. 8V。 最 大 的 时 钟 频率 是 与 供电 电压 相 
关 的 函数 。 减 小 供电 电压 将 使 能 耗 以 二 次 方 数 下 降 ， 算法 的 运行 时 间 将 以 线性 的 方 
式 增长 〈 不 考虑 内 存 系统 的 影响 ) 。 这 就 可 以 解释 动态 电压 调整 (Dynamic Voltage 
Scaling, DVS) 技术 的 应 用 。 如 Transmeta [ Klaiber, 2000] 的 Crusoe 处 理 器 在 
1.1 ~1.6V 的 供电 电压 之 间 提 供 了 32 个 可 选 挡 位 ， 相应 的 时 钟 频率 也 可 以 按 
33MHz 的 步 长 从 200 ~700MHz 变化 ， 从 一 组 电压 /频率 转 到 下 一 组 大 约 需 要 20ms。 
在 Burd 与 Brodersen [ Burd and Brodersen, 2000] 的 一 篇 论文 中 ,详细 地 描述 了 
DVS 处 理 髓 的 设计 相关 问题 。 根 据 这 篇 论文 的 论述 ， 未 来 也 许可 以 通过 降低 最 大 
Vasa， 同时 降低 门限 电压 (但 不 幸 的 是 ， 这 可 能 会 增加 漏电 流 ， 也 可 能 会 增加 待机 
时 的 功 耗 ) 来 完成 。 在 2004 年 ，Intel@ SpeedStep ™ ZE Pentium® M 处 理 器 上 提供 了 
6 种 可 变 的 速度 /电压 ， 从 而 降低 了 系统 功 耗 。 

2) 代码 大 小 : 由 于 嵌入 式 系统 一 般 不 外 接 硬 盘 驱 动 器 ， 它 的 可 用 内 存 也 比较 
有 限 ， 因 此 减 小 代码 大 小 对 于 嵌入 式 系 统 也 非常 重要 9 。 对 于 片上 系统 ( Systems 
on a Chip, SoC ) ， 这 一 点 更 为 重要 : 对 于 SoC， 其 内 存 与 处 理 器 是 在 同一 块 芯片 
上 ， 这 种 情况 下 的 内 存 一 般 被 称 为 片 内 内 存 。 由 于 片 内 内 存 的 制造 要 与 处 理 器 兼 
容 ， 这 就 使 得 其 工艺 更 加 复杂 ， 成 本 也 非常 高 昂 ， 片 内 内 存 也 有 可 能 占 去 芯片 的 大 
部 分 可 用 面积 。 有 多 种 技术 可 以 用 于 改善 代码 大 小 : | 

J CISC 架构 : 标准 的 RISC 处 理 器 更 倾向 于 运行 速度 ， 而 不 是 代码 大 小 。 而 
早期 的 复杂 指令 集 (CISC) 处 理 器 一 般 与 低速 内 存 相连 ， 通常 也 不 使 用 高 速 缓存 ， 
它 则 更 倾向 于 代码 大 小 的 优化 。 这 种 “过 时 ”的 CISC Wb HB BR RTT LER AR 
统 中 找到 ， 如 基于 CISC 架构 的 Motorola 68000 系列 的 ColdFire 处 理 器 [ Freescale 
semiconductor, 2005 ] 。 

D 压缩 技术 : 为 了 减 小 指令 寻 址 的 开销 ， 从 而 减少 对 硅 片面 积 的 需求 ， 指 令 
通常 都 以 压缩 格式 存储 在 内 存 中 ， 这 种 做 法 同时 也 降低 了 存 取 指 令 的 功 耗 。 使 用 压 
缩 技术 ， 即 使 减少 带宽 ， 存 取 指 
令 同 样 可 以 做 到 很 快 。 译 码 器 aa 
(希望 它 是 占 硅 片面 积 小 而 且 速 度 TEN 
小 的 模块 ) 处 于 处 理 器 与 内 存 之 | ROM 
间 ， 它 将 压缩 指令 还 原 为 原始 指 
S ( 见 图 3.17 右 图 )8。 存 储 经 ag eas 
压缩 的 指令 ， 而 不 是 未 压缩 的 原 
始 指令 ， 这 样 就 减少 了 对 内 存 的 图 3 17 压缩 指令 的 解压 缩 





HP uP 














地 址 


























O 大 型 闪存 类 内 存 的 使 用 ， 减 小 了 对 代码 大 小 方面 的 约束 。 
© 依然 使 用 方 框 来 表示 多 路 复 用 器 、 算 法 单元 以 及 内 存 ， 它 们 在 本 书 中 都 会 被 广泛 使 用 。 对 于 内 存 ， 
使 用 含 一 个 地 址 译 码 器 的 模块 (对 ROM 也 适用 ) 来 表示 ， 其 中 的 译 码 器 也 指出 了 地 址 的 输入 。 
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需求 。 

压缩 的 目的 可 以 总 结 如 下 : 

a 节省 片 内 的 ROM 与 RAM， 因 为 它们 可 能 比 处 理 器 要 昂贵 。 

b. 可 以 对 指令 使 用 一 些 译 码 技术 ， 对 于 具有 以 下 属性 的 数据 ， 也 可 以 使 用 
译 码 : 

a) 数据 对 操作 延 时 不 敏感 ; 

b) 译 码 应 该 在 有 限 的 空间 中 工作 (例如 ， 它 不 可 能 在 整个 代码 中 去 查找 一 条 
分 支 指令 的 目的 地 ) ; 

c) 需要 考虑 到 内 存 、 指 令 与 取 址 的 字 长 ; 

d) 必须 支持 分 支 指令 的 随机 寻 址 ; 

e) 快速 编码 仅 在 有 可 写 的 数据 需要 被 编码 时 才 需 要 ， 和 否则 快速 译 码 就 足 
够 了 。 

减 小 代码 量 的 技术 还 有 许多 变异 : 

a, 某 些 处 理 器 还 有 第 二 类 指令 集 (Second Instruction Set) 。 第 二 类 指令 集 有 
更 精简 的 指令 格式 。ARM 处 理 器 系列 就 是 存在 第 二 类 指令 集 的 典型 例子 。ARM 指 
令 集 是 包含 预测 指令 的 32 位 指令 集 ， 当 且 仅 当 满 足 某 些 条 件 的 前 提 下 ， 相 应 的 指 
令 才 会 得 到 执行 。 指 令 中 提 及 的 条 件 是 指令 格式 中 的 最 高 4 位 。 大 部 分 的 ARM 处 
理 器 也 提供 了 第 二 类 指令 集 ， 它 使 用 16 位 宽 ， 称 之 为 THUMB 指令 集 。 由 于 不 需 
要 支持 预测 指令 ，THUMB 指令 集 更 加 精简 ， 它 使 用 更 少 的 操作 数 以 及 寄存 器 ( 见 
图 3.18)。 





“001” “10" Rd 常量 16 位 THUMB 指 令 











“1110” “001” “01001”'0”&Rd “0”&Rd “0000”& 常量 


图 3.18 THUMB 重 编码 为 ARM 指令 


在 程序 执行 时 ，THUMB 指令 可 以 动态 地 转 到 ARM 指令 继续 执行 。 由 于 它 的 
算法 指令 只 使 用 一 半 寄 存 器 ， 因 此 THUMB 指令 的 寄存 器 位 域 总 是 与 一 个 ‘ 0” 位 相 
4°, THUMB 指令 的 源 寄存 器 与 目的 寄存 器 是 完全 一 样 的 ， 常 量 的 长 度 被 减 小 到 
T 4bit。 在 指令 执行 中 ,使 用 了 流水 线 来 提高 运行 时 的 效率 。 

某 些 其 他 的 处 理 器 也 有 类 似 的 技术 。 这 种 实现 的 缺点 在 于 必须 对 工具 (编译 
Ae, Winar, Miir) 进行 扩展 ， 这 样 才能 支持 第 二 类 指令 集 。 因 此 ,为 了 支 











O 这 里 使 用 了 VHDL 的 符号 ， 图 3. 18 中 用 一 个 & 符号 来 表示 连接 ， 其 后 的 引号 中 跟着 常量 。 
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持 第 二 类 指令 集 ， 可 能 会 增加 软件 开发 的 成 本 。 

b. 第 二 种 技术 是 使 用 字典 (Dictiona- 
ries) 。 使 用 这 种 技术 ， 每 种 形式 的 指令 都 被 
惟一 存储 ， 对 于 不 同 的 程序 计数 器 值 ( 即 
PC) ， 通 过 一 个 查找 表 ， 在 指令 空间 ， 也 就 
是 在 字典 中 去 查找 相应 的 指令 〈 见 图 3. 19) 。 y 32bit 

这 种 技术 首先 是 基于 只 使 用 了 较 少 的 指 uP i 
SHCHLOIIAE, RERE, CHART) wena 
才 不 会 有 太 多 的 查找 人口， 指令 的 位 宽 也 才 
会 比较 短 。 这 种 技术 也 有 许多 变异 : 如 双 级 控制 存储 ( Two- level Control Store) 
[ Dasgupta, 1979] , 微 程序 设计 ( Nanoprogramming ) [ Stritter and Gunter, 1979 | 
或 非 队 内 程序 (procedure Ex- lining) [ Vahid, 1995], 

Beszedes [ Beszedes, 2003] 与 Latendresse [ Latendresse, 2004] 在 其 论文 中 对 
已 知 的 压缩 技术 提供 了 简要 介绍 。 

3) 运行 时 效 : 为 了 在 不 提高 时 钟 频率 的 前 提 下 尽量 满足 软件 的 运行 时 间 要 
求 ， 在 某 些 应 用 领域 可 以 有 针对 性 地 选用 处 理 器 ， 如 数字 信和 号 处 理 器 ( DSP)， 更 
进一步 ， 可 以 设计 特定 应 用 指令 集 处 理 器 ( Application- Specific Instruction set Pro- 
cessors ，ASIP) 。 作 为 特定 领域 的 处 理 器 代表 ， 下 面 考 虑 一 下 DSP。 在 数字 信和 号 处 
理 中 ， 数 字 滤波 是 常 有 的 操作 之 一 。 假 定 将 图 3.48 所 示 的 滤波 处 理 展开 ， 同 时 对 
其 中 的 信号 进行 转换 ， 如 图 3. 20 所 示 。 


~ 
O 


a dap Sfap]¥ 
二 | Hika [| BE 处 理 


图 3. 20 信号 的 转换 





指令 地 址 





小 _---- 指 令 指针 





<<32bit 


使 用 的 指令 表 ) 查询 入 口 























| zx) 











式 (3.16) 描述 了 从 输入 信号 w(t) 经 过 数字 滤波 ， 而 后 产生 输出 信和 号 x(1) 
的 过 程 。 这 两 个 信号 都 在 时 间 {i 内 有 定义 。 为 简单 起 见 ， 用 x ORE x(t), 用 
w, 代替 w(t.) 。 


n-1 
6 = > #4 * a, (3. 16) 
f=0 


输出 的 信号 x, 是 信号 w 的 后 n 个 信号 的 加 权 平均 ， 它 可 以 按 每 次 在 当前 结果 
中 加 上 乘积 的 方式 进行 迭代 计算 。 对 于 DSP， 每 一 次 的 迭代 仅 使 用 单一 指令 就 可 以 
完成 。 来 看 一 个 例子 : 图 3.21 展示 了 ADSP 2100 DSP 的 内 部 架构 。 





〇 ”此 处 原 书 似 有 误 ， 应 为 图 3. 2。 一 一 译 者 注 
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图 3.21 ADSP 2100 DSP 的 内 部 架构 
注 : 此 处 原 书 似 有 误 ， 图 中 “A0、Al、Al…” 应 为 “A0、Al、A2…”。 一 一 译 者 注 











这 个 处 理 器 有 两 块 内 存 ， 称 之 为 D 与 P。 地 址 产生 单元 (Address Generating 
Unit, AGU) 用 于 提供 访问 内 存 的 指针 。 加 法 与 乘法 有 不 同 的 处 理 单元 ， 它 们 都 有 
自己 的 参数 寄存 器 AX. AY, AF, MX, MY 与 MF。 在 乘法 器 的 下 面 又 连接 了 一 个 
加 法 器 ， 从 而 更 快 地 对 乘 加 操作 进行 计算 。 

对 于 这 个 处 理 器 ， 单 次 循环 一 般 都 只 需要 一 个 时 钟 周期 。 因 此 ， 内 存单 元 D 
与 P 分 别 被 用 于 存储 数组 w 与 a, 为 了 使 相关 的 指针 能 在 ACU 中 得 到 更 快 更 新 ， 
也 需要 占用 一 些 地 址 寄存 器 。 操 作 过 程 中 的 部 分 和 将 存储 在 MR 中 ， 计 算 的 流水 线 
使 用 了 寄存 器 Al, A2, MX 和 MY。 

采样 时 间 i, 内 的 外 层 循环 状况 如 下 : 

{ MR:=0; A1:=1; A2:=s-1; MX:=w[s]; MY:=a[0]; 

for (k=0; k <= (n— 1); k++) 

{MR:=MR + MX * MY; MX:=w[A2]; MY:=a[A1]; 








A1++; A2--; } 
Xx[s]:=MR; } 
外 层 循环 与 处 理 时间 是 对 应 的 。 内 部 的 循环 体 将 被 编码 成 单一 指令 ， 包 含 如 下 


的 操作 : 

D 从 MX 与 MY 两 个 参数 寄存 器 中 读 取 参数 ， 将 两 个 参数 相 乘 而 后 与 部 分 和 
相 加 ， 再 存储 到 部 分 和 寄存 器 中 ; 

@ 从 内 存 P 与 D 中 读 取 数据 a 与 w 的 下 一 个 元 素 ， 而 后 将 它们 存储 到 相应 的 
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参数 寄存 器 MX 与 MY 中 ; 

© 更 新 指向 下 一 个 参数 的 指针 ， 并 存储 到 地 址 寄存 器 Al 与 A2 th, 

@ 循环 最 后 的 测试 。 

使 用 这 种 方式 ， 内 层 循环 中 的 每 一 次 迭代 都 只 需要 一 条 指令 。 为 了 实现 这 一 
点 ， 多 个 操作 也 需要 并 行 执行 。 对 于 给 定 的 计算 需求 ， 这 种 (有 限 的 ) 并 行 化 降 
低 了 对 时 钟 频率 的 要 求 。 更 进一步 的 ， 这 种 架构 中 的 寄存 器 完成 的 是 不 同 的 功能 ， 
它们 可 以 被 称 为 是 异 构 的 (Heterogeneous ) 。 对 于 DSP， 异 构 的 寄存 器 文件 是 其 很 
常见 的 特征 。 为 了 避免 在 循环 尾部 的 测试 带 来 额外 的 系统 开销 ， 在 DSP 上 也 常 当 
使 用 零 开销 循环 指令 (Zero- Overhead Loop Instructions ) 。 使 用 这 种 指令 ， 在 一 个 国 
定 的 时 间 段 内 可 以 执行 单个 或 较 少 的 多 条 指令 。 而 没有 此 类 优化 的 DSP， 为 了 完成 
循环 内 部 的 迭代 ， 将 需要 多 条 指令 ， 从 而 它 有 可 能 需要 更 高 的 时 钟 频率 。 

在 上 面 描述 的 例子 中 ， 如果 ft) 是 无 界 的 ， 则 数组 w 与 x 也 将 需要 无 限 大 
小 。 由 于 只 有 需要 个 最 近 的 值 ， 因 此 可 以 去 按 需 要 来 约束 这 些 数组 的 大 小 。 同 
时 ， 使 用 模 寻 址 方式 ， 可 以 对 这 些 数组 的 空间 进行 重用 ( 见 下 面 的 部 分 )。 
3.3.3.1 DSP 

为 了 在 循环 体 中 以 一 条 指令 来 实现 上 面 滤波 功能 ，DSP 针对 不 同 的 应 用 领域 提 
供 了 一 系列 特性 : 

1) 特定 的 寻 址 方式 : 在 上 面 描述 的 滤波 器 设计 中 ， 只 需要 使 用 信号 w 的 最 后 
n 个 元 素 ， 这 可 以 使 用 环形 缓冲 区 。 使 用 模 寻 址 方式 (Modulo Addressing) 可 以 很 
容易 地 做 到 对 环形 缓冲 区 的 访问 。 在 模 寻 址 方式 中 ， 只 有 访问 缓冲 区 中 的 第 一 个 或 
者 是 最 后 一 个 元 素 ， 地 址 才 会 增加 或 者 减少 ， 除 此 之 外 的 地 址 增 减 ， 将 会 导致 地 址 
指针 指向 缓冲 区 的 其 他 结束 位 置 。 

2) 独立 的 地 址 产生 单元 : 地 址 产生 
单元 (Address Generation Units, AGU ) 
通常 与 数据 存储 区 的 地 址 输入 直接 连接 
( 见 图 3.22)。 

在 地 址 寄存 器 中 的 地 址 也 可 以 被 用 
于 寄存 器 间接 寻 址 模式 ， 它 可 以 节省 机 
arta. IATA LAR ABH. NW THRE 
地 址 寄存 器 的 利用 率 ， 对 于 用 到 地 址 寄 
存 器 的 大 部 分 指令 ， 都 包含 着 自动 递增 图 3. 22 使 用 特殊 地 址 寄存 器 的 ACU 
或 自动 递减 的 功能 。 

3) 饱和 算法 : 饱和 算法 改变 了 计算 中 的 上 溢出 与 下 溢出 的 处 理 方式 。 在 标准 
的 二 进 制 算 法 中 ， 在 上 溢出 或 下 溢出 时 将 使 用 循环 进位 方法 进行 计算 。 图 3. 23 展 
示 了 两 个 4bit 无 符号 数 相 加 的 情况 ， 可 以 看 出 ， 在 标准 寄存 器 中 没有 返回 计算 后 的 
进位 ， 而 是 全 零 ， 与 真实 的 计算 结果 相差 也 最 大 。 








M 组 修改 
寄存 器 
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在 饱和 算法 中 ， 将 尽量 返回 与 真实 计 0111 
算 结果 最 接近 的 数值 。 在 发 生 上 溢出 时 返 H 
回 最 大 值 ， 而 在 下 溢出 时 返回 最 小 值 。 这 “人 和 算法 li 
种 实现 方法 对 于 某 些 领域 尤其 重要 ， 如 音 


a 图 3. 23 无 符号 整数 的 循环 进位 与 
频 或 视频 应 用 : 用 户 其 实 很 难 区 分 出 真实 饱和 算法 的 比较 


的 计算 结果 与 表达 出 的 最 大 值 引起 的 差 
异 。 另 外 ， 因 为 在 实时 运行 中 很 难 作 异 常 处 理 ， 它 也 可 以 用 在 溢出 发 生 的 情况 中 。 
需要 注意 的 是 ， 在 使 用 饱和 算法 时 ， 需 要 清楚 正在 处 理 的 是 有 符号 还 是 无 符号 加 法 
指令 ， 从 而 返回 正确 的 符号 位 。 

4) 定点 算法 : 浮 点 算法 的 硬件 会 增加 处 理 器 的 成 本 与 功 耗 。 因 此 据 估计 ， 目 
前 大 约 80% 的 DSP 均 不 包含 浮 点 硬件 [Aamodt and Chow，2000] 。 但 为 了 支持 整 
型 数 ， 多 数 处 理 器 都 必然 支持 定点 算法 。 定 点 数 可 以 从 3 个 方面 (wl, iwl, sign) 
来 描述 ， 其 中 wl 是 总 字 长 ，iwl 是 整数 字 长 (二进制 小 数 点 的 左 侧 位 数 )， 符 号 
sels, ul 表示 了 被 处 理 的 数 是 有 符号 或 无 符号 数 。 定 点 数 这 3 个 方面 的 关系 可 参 
考 图 3.24。 可 以 使 用 的 有 多 种 进位 模式 ( 如 截断 ) 与 溢出 模式 (如 饱和 算法 与 循 
环 进位 算法 ) 。 对 于 定点 数 ， 在 乘法 操作 之 后 将 保持 其 二 进 制 小 数 点 的 位 置 (一 些 
低位 将 被 截断 或 循环 移 位 ) 。 对 于 定点 处 理 器 ， 这 一 操作 是 由 硬件 来 支持 的 。 

5) 实时 性 能 : 在 现代 PC 中 使 用 的 处 理 器 中 ， 符号 二 进 制 小 数 点 
都 有 一 些 特性 去 提高 程序 的 平均 执行 时 间 。 在 一 些 j 
场景 中 ， 很 难 或 者 根本 不 可 能 去 验证 这 些 特性 是 否 s 
提高 了 最 坏 情 况 下 的 执行 时 间 。 在 某 些 场景 中 ， 甚 iwl fwl 
至 最 好 不 要 去 使 用 这 些 特性 ， 如 很 难保 证 〈 也 许 就 wl 
是 不 可 能 [Absint, 2002]) 通过 使 用 缓存 来 对 系统 ws 24 定点 数 系 统 的 参数 
进行 提速 。 因 此 ,许多 能 入 式 处 理 器 都 没有 缓存 ， 
甚至 虚拟 地 址 与 分 页 也 一 般 不 在 做 入 式 系统 中 使 用 。 计 算 最 坏 情况 执行 时 间 的 技术 
在 5.2.2 节 将 有 更 详细 的 描述 。 

6) 多 内 存 区 或 多 内 存 : 使 用 多 内 存 区 的 好 处 已 经 在 ADSP 2100 中 得 到 了 证 明 : 
两 个 内 存 区 D 与 P 允许 在 同一 时 刻 读 取 两 个 参数 。 多 种 DSP 均 使 用 了 两 个 内 存 区 。 
7) 异 构 寄 存 器 文件 : 异 构 寄 存 器 文件 已 经 在 滤波 器 的 应 用 部 分 提 到 了 。 

8) 乘 加 指令 : 这 类 指令 在 乘法 之 后 紧 随 着 加 法 操作 ， 它 们 也 在 滤波 器 应 用 部 
分 使 用 到 了 。 
3.3.3.2 多 媒体 处 理 器 /指令 

在 许多 现代 处 理 器 的 架构 中 ， 寄 存 器 与 算法 单元 至 少 都 是 64 bit 宽 的 。 因 此 ， 
两 个 32 bit 的 数据 类 型 (“ 双 字 ”) 、4 个 16 bit 的 数据 类 型 (“ 字 ”) 或 8 个 8 bit 的 
数据 类 型 (“ 字 节 ”) 可 以 被 一 次 性 存储 在 单一 寄存 器 中 ( 见 图 3. 25 )。 

有 较 大 位 宽 的 算法 单元 可 以 在 双 字 、 字 或 字 节 的 边界 处 更 好 地 处 理 进位 。 在 此 
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基础 上 ， 多 媒体 指令 也 可 以 对 压缩 的 数 
据 类 型 进行 操作 。 由 于 单一 指令 实现 了 | 宁 3 | 字 2 | 字 1 | žo 
对 多 个 数据 单元 的 操作 ， 这 类 指令 有 时 。。 大 3 25 ewe ome bi 
被 称 为 单 指令 多 数据 (Single- Instruc- 
tion Multiple- Data，SIMD) 。 相 比 未 经 压缩 的 字 节 存储 情况 ， 将 多 个 字 节 压 缩 存储 
到 一 个 64 bit 寄存 器 时 最 高 可 将 访问 速度 提高 8 倍 。 在 内 存 中 的 数据 一 般 也 以 压缩 
方式 进行 存储 。 如 果 算 法 指令 可 以 用 于 压缩 的 数据 类 型 ， 则 就 不 需要 再 对 数据 进行 
解压 。 更 进一步 地 ， 多 媒体 指令 通常 可 以 与 饱和 算法 结合 起 来 ， 从 而 能 比 标准 指令 
提供 更 高 效 的 溢出 处 理 方式 。 因 此 ， 使 用 多 媒体 指令 与 压缩 存储 可 以 提供 比 单独 使 
用 压缩 存储 更 高 效 的 访问 。 由 于 压缩 的 数据 类 型 带 来 的 好 处 ， 在 许多 处 理 器 中 也 添 
加 了 新 的 指令 。 例 如 ， 一 种 被 称 为 单 指令 多 数据 流 扩展 ( Streaming SIMD Extensions, 
SSE ) 的 指令 已 经 被 添加 到 了 Intel 系列 的 Pentium@ 兼 容 处 理 器 中 「 Intel，2008 ] 。 
当前 (在 2010 Æ), Intel® Advanced Vector Extensions (先进 向 量 扩展 ，AVX) 还 
使 用 了 短 向 量 指令 集 (Short Vector Instructions) [Intel, 2010a] 。 
3.3.3.3 VLIW 处 理 器 

和 入 式 系统 的 计算 需求 一 直 在 增长 ， 尤 其 是 在 包含 了 高 级 编码 技术 或 加 密 的 多 
媒体 应 用 领域 。 在 高 性 能 的 微 处 理 器 中 使 用 的 性 能 提升 技术 并 不 适合 于 相信 式 系 
统 : 它 可 能 需要 考虑 指令 兼容 ， 资 源 寻 找 ， 如 在 PC 中 花费 大 量 的 资源 及 功 耗 去 查 
找 应 用 程序 中 的 并 行 操作 。 即 使 是 这 样 ， 它 们 的 性 能 往往 仍然 不 能 满足 需求 。 而 对 
于 内 入 式 系统 ， 首 先 不 必 考 虑 与 PC 的 指令 兼容 ， 这 样 就 可 以 明确 使 用 特定 的 指令 
进行 并 行 操作 。 并 行 指令 代码 (Explicit Parallelism Instruction set Computers, EPIC) 
可 以 完成 这 一 功能 。 使 用 EPIC， 把 对 并 行 操作 的 查找 任务 从 处 理 器 转移 到 了 编译 
器 ， 这 就 在 运行 过 程 中 节省 了 芯片 内 部 资源 及 能 量 。 作 为 一 种 特例 ， 下 面 来 考虑 其 
长 指令 字 (Very Long Instruction Word, VLIW) 处 理 器 。 对 于 VLIW 处 理 器 ， 某 些 
操作 或 指令 被 共同 编码 在 一 个 长 指令 字 中 (有 时 被 称 为 指令 包 ) ， 这 一 指令 中 所 有 
操作 的 执行 是 并 行 的 。 每 一 个 操作 /指令 被 分 别 编码 成 指令 包 中 的 一 部 分 ， 每 一 部 
分 又 控制 着 相应 的 硬件 单元 。 如 图 3. 26 所 示 ， 每 一 部 分 都 控制 着 一 个 硬件 单元 。 





























对 于 VLIW 架构 ， 编 译 ”< 指令 包 
器 负责 产生 指令 包 。 这 就 需 指 41 | n | 指 $3 | 指令 4 
要 编译 器 明确 可 用 的 硬件 单 J J T | 








存储 器 单元 








元 ， 从 而 对 它们 的 使 用 作出 Tye pean | nE | E | 
合理 的 调度 。 

无 论 功 能 单元 是 否 在 指 一 
令 周 期 中 被 使 用 ， 它 都 必须 图 3.26 VLIW 架构 〈 例 ) 
出 现在 指令 中 的 相应 部 分 。 如 果 不 能 对 指令 包 中 的 各 部 分 进行 充分 利用 ， 则 可 能 会 
降低 VLIW 架构 的 代码 密度 。 但 如 果 对 VLIW 添加 更 多 的 灵活 性 ， 则 可 以 解决 这 一 问 
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题 。 如 Texas Instruments TMS 320C6xx 处 理 骨 系 列 的 变 长 指令 包 ， 其 长 度 可 以 达到 
256 bit。 在 指令 包 中 的 每 一 部 分 ， 都 保留 了 1bit 来 说 明 下 一 部 分 的 指令 是 否 应 当 并 行 
执行 〈 见 图 3.27) 。 这 样 ， 对 于 未 使 用 的 功能 单元 ， 就 不 会 有 宛 祭 指令 的 操作 。 


31 0 31 0 31 0 31 0 31 0 31 0 31 0 
9 J es | 























Al 3.27 TMS 320C6xx 的 指令 包 


由 于 使 用 了 变 长 指令 包 ，TMS 320C6xx 处 理 器 与 经 典 的 VLIW 处 理 器 显得 并 不 
一 致 ， 但 由 于 它 也 能 明确 描述 并 行 操作 ， 因 此 它 仍然 是 EPIC 处 理 器 。 

1. 分 离 的 寄存 器 文件 

对 于 VLIW 与 EPIC 处 理 器 ， 它 们 的 寄存 器 文件 设计 也 非常 重要 。 由 于 并 行 指 
令 会 执行 更 多 的 操作 ， 因 此 在 并 行 指令 模式 下 就 需要 进行 大 量 的 寄存 器 访问 ， 也 就 
需要 大 量 的 访问 端口 。 但 是 ， 如 果 增 加 处 理 器 内 部 的 端口 ， 则 也 会 增加 寄存 器 的 延 
时 、 大 小 以 及 能 耗 。 因 此 ， 许 多 VLIW/EPIC 架构 都 使 用 分 离 的 寄存 器 文件 。 功 能 
单元 只 与 寄存 器 文件 的 一 部 分 相连 接 。 如 在 图 3. 28 中 展示 的 TMS 320C6xx 处 理 器 
的 内 部 架构 ， 它 包含 了 两 个 寄存 器 文件 ， 每 个 寄存 器 文件 都 与 一 半 的 功能 单元 相连 
接 。 对 于 两 个 寄存 器 文件 连接 到 相同 功能 单元 的 情况 ， 在 一 个 时 钟 周期 ， 只 人 允许 一 
个 寄存 器 文件 对 功能 单元 进行 访问 。 

Lapinskii 等 人 [ Lapinskii et al. , 2001] 对 寄存 器 分 离 方 法 进行 了 更 多 的 讨论 。 

许多 DSP 都 是 基于 VLIW 架构 的 ， 以 M3- DSP 处 理 器 [Fettweis et al. , 1998 ] 
为 例 。 它 包含 (相当 于 ) 16 个 并 行 数据 通路 VLIW 处 理 器 ， 这 些 数据 通路 与 一 组 
内 存 相连 ， 并 行 地 提供 处 理 器 需要 的 参数 ( 见 图 3. 29)。 








数据 通路 A 数据 通路 B 256bit 宽 内 存 ) 


A 组 寄存 器 D B 组 寄存 器 T 4 
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数据 通路 1 
据 通路 

数据 通路 14 

数据 通路 15 


内 存 访 问 通 路 











图 3.28 TMS 320C6xx 分 离 的 寄存 器 文件 图 3.29 M3-DSP ( 简 图 ) 
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2. 预测 指令 
VLIW 与 EPIC 架构 可 能 有 较 大 的 延 时 损耗 (Delay Penalty) ， 这 是 它们 的 潜在 
问题 之 一 : 这 种 延 时 损耗 可 能 产生 在 一 些 指令 包 的 跳 转 指令 中 。 指 令 包 正常 时 都 是 
按 流 水 线 逐 一 得 到 执行 ， 流 水 线 的 每 个 阶段 仅 实现 需要 执行 指令 的 部 分 操作 ， 这 就 
意味 着 在 流水 线 的 第 一 阶段 不 会 发 现 跳 转 指令 的 存在 。 当 跳 转 指令 最 后 执行 完成 
后 ， 其 他 指令 已 经 进入 了 流水 线 (JILE 3.30), 
ARNE 
流水 线 L cai a =o à 取 指 
= aa 
| | 分 支 ] 执行 
= C T] esns V; 


















































图 3. 30 分支 指令 与 延 时 位 置 


有 两 种 基本 的 方法 来 解决 这 种 情况 : 

1) 将 跳 转 指令 按 正常 指令 执行 。 这 种 方式 被 称 为 延迟 跳 转 (Delayed 
Branch) 。 在 跳 转 指令 之 后 执行 的 指令 包 的 位 置 ， 被 称 为 跳 转 延迟 位 置 (Branch 
Delay Slots) 。 这 些 跳 转 延迟 位 置 可 以 被 填充 成 在 跳 转 指令 之 前 执行 的 指令 。 但 是 ， 
将 所 有 的 延迟 位 置 填充 成 有 用 的 指令 是 非常 困难 的 事情 ， 有 一 些 延 迟 位 置 必须 以 空 
操作 指令 (No-Operation Instructions, NOP) 进行 填充 。 术语 跳 转 延迟 损耗 
( Branch Delay Penalty) 也 表达 了 因为 NOP 的 填充 导致 的 性 能 降低 。 

2) 阻塞 流水 线 直到 跳 转 指 令 取 址 完成 。 在 这 种 情况 下 不 存在 跳 转 延迟 位 置 ， 
它 的 跳 转 延迟 损耗 是 因 流 水 线 的 阻塞 而 引起 的 。 

有 时 候 跳 转 延迟 会 极 大 地 影响 系统 性 能 。 如 TMS 320C6xx 系列 处 理 器 最 多 可 
以 允许 40 个 延迟 人 位置。 因此， 如 果 可 以 避免 跳 转 ， 则 可 以 提升 系统 性 能 。 为 了 避 
SoA 诗 判 断 而 引起 的 跳 转 ， 引 入 了 预测 指令 技术 。 对 于 每 一 条 预测 指令 ， 都 被 纺 
码 成 数 个 位 并 在 运行 时 进行 检查 。 如 果 检 查 的 结果 为 真 ， 则 执行 指令 ， 否 则 转 为 执 
ÍT NOP 指令 。 在 类 似 于 ARM 的 RISC 处 理 器 中 也 存在 预测 指令 。 如 在 3. 3.3 节 中 
介绍 的 ARM 指令 ， 就 包含 一 个 4bit 的 位 域 ， 它 可 以 对 条 件 码 寄存 器 中 的 不 同 值 进 
行 编码 。 存 储 在 条 件 码 寄存 器 中 的 值 在 运行 时 都 会 被 检查 ， 它 们 决定 了 一 系列 的 指 
令 是 否 会 有 影响 。 

预测 指令 可 以 在 一 些 较 小 的 辽 状 态 下 非常 有 效 : ff 的 条 件 被 存储 在 其 中 的 一 个 
条 件 寄存 器 中 ， 而 依赖 于 站 条 件 的 主体 语句 则 被 作为 预测 指令 执行 。 这 样 ， 站 状态 
的 主体 就 能 与 其 他 操作 一 起 执行 而 不 会 引起 延迟 损耗 。 

Crusoe (在 商业 上 并 没有 成 功 ) 是 为 PC 使 用 而 设计 的 一 种 EPIC 处 理 器 
[ Klaiber，2000]。 在 PC 上 为 了 应 用 EPIC 指令 集 而 做 出 的 努力 成 就 了 Intel 的 IA-64 
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指令 集 [ mtel，2010b] ， 它 也 应 用 在 Itanium @ 处 理 器 上 。 由 于 政策 上 的 问题 ， 它 
的 主要 应 用 领域 仅 在 服务 器 市 场 。 许 多 片上 多 处 理 器 系统 (MPSoC ) (参考 
3.3.3.5 节 ) 都 是 基于 VLIW 与 EPIC 的 处 理 器 。 
3.3.3.4 微 控制 器 

事实 上 ， 购 入 式 系统 中 大 量 使 用 的 都 是 微 控制 器 。 微 控制 器 往往 并 不 复杂 ， 使 
用 起 来 也 比较 容易 。 由 于 它们 与 控制 系统 设计 的 相关 性 ， 下 面 介绍 一 种 使 用 频率 最 
高 的 处 理 器 ， 即 Intel 8051 ， 它 有 如 下 特性 : 

1) 8 bit CPU， 针 对 控制 领域 作 了 大 量 优化 ; 

2) 有 大 量 布 尔 数据 类 型 的 操作 指令 ; 

3) 64KB 的 程序 寻 址 空间 ; 

4) 64KB 的 独立 数据 寻 址 空间 ; 

5) 片上 有 4KB 的 片上 程序 RAM，128B 的 片上 数据 RAM; 

6) 32 个 IO, 每 个 IO 都 可 以 被 独立 寻 址 ; 

7) 片上 两 个 计数 器 ; 

8) 片上 有 串 行 的 通用 异步 接收 /传输 端口 ; 

9) 片上 时 钟 产 生 器 ; 

10) 有 许多 商业 化 的 变异 结构 。 

对 于 微 控制 器 ， 以 上 这 些 特 性 都 是 比较 典型 的 。 
3.3.3.5 MPSoC 

提升 处 理 器 时 钟 频率 来 获取 性 能 提升 的 方式 ， 近 年 来 已 经 基本 停止 使 用 。 处 理 
器 使 用 数 GH, 的 时 钟 频率 带 来 的 高 能 耗 是 
主要 因素 之 一 。 为 了 进一步 提升 整体 性 
能 ， 有 必要 使 用 多 个 处 理 器 。 这 使 得 在 世 
片 设计 中 ， 像 添加 外 设 器 件 与 内 存 等 附加 
模块 一 样 ， 也 可 以 包含 多 个 处 理 器 。 以 这 
种 方式 实现 的 系统 ， 称 之 为 (MPSoC ) 。 
对 于 通用 目的 的 计算 与 PC， 多 处 理 器 系 
统 通常 都 是 同 构 (Homogeneous) 的 (所 
有 处 理 器 都 是 同 种 类 型 )。 术 语 多 核 
( Multi-core) 系统 都 通常 与 此 类 系统 相关 。 图 3.31 SH-MobileG1 芯片 的 Floor-plan 
对 于 藤 入 式 系统 ， 能 耗 需要 在 设计 中 被 重 
点 考虑 。 低 能 耗 通常 需要 通过 高 度 定制 的 处 理 器 来 实现 。 如 在 移动 通信 或 图 像 处 理 
领域 ， 就 有 许多 定制 的 处 理 器 。 图 3.31 包含 了 SH-MobileG1 芯片 的 Floor-plan 
[ Hattori, ，2007 ] 。 

这 个 芯片 展示 了 高 度 定制 的 处 理 器 的 使 用 : 对 于 MPEG 与 JPEG 编码 ，GSM 与 
3G 移动 通信 等 领域 都 有 特定 的 处 理 器 。 为 了 节省 能 量 ， 未 使 用 的 区 域 通常 都 处 于 
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关 断 状态 。 使 用 顺序 语言 在 多 核 架 构 的 系统 上 进行 编程 是 一 个 挑战 ， 这 在 第 6 章 将 
进行 讲述 。 在 这 类 处 理 器 上 的 应 用 实现 技术 非常 重要 ， 因 为 例子 展示 了 它 同样 可 以 
达到 与 ASIC 接近 的 能 耗 情 况 。 举 例 来 说 ，IMEC 的 ADRES 处 理 器 ， 它 每 瓦 可 以 进 
行 大 约 55 x 10 次 操作 (能 耗 大 约 是 ASIC 的 50%) [Man, 2007], [IMEC, 
2010] 。 


3.3.4 可 编程 序 逻 辑 


在 许多 情况 下 ， 高 度 定制 的 芯片 (ASIC) 成 本 过 于 昂贵 ， 而 软件 解决 方案 的 
效率 低 且 能 耗 较 高 。 如 果 算 法 在 定制 的 硬件 上 可 以 高 效 运行 ， 则 也 可 以 考虑 使 用 可 
编程 序 逻 辑 来 解决 这 一 问题 。 可 编程 序 逻 辑 与 ASIC 的 运行 效率 几乎 一 样 ， 它 与 
ASIC 不 同 的 是 其 功能 可 以 被 重新 编程 。 基 于 这 些 属性 ， 可 编程 序 逻 辑 可 以 应 用 到 
如 下 领域 . 

1) 快速 原型 : 当前 流行 的 ASIC 都 比较 复杂 ， 它 的 设计 工作 耗费 的 时 间 与 成 
本 都 非常 大 。 因 此 通常 需要 先 设计 一 个 产品 原型 ， 从 而 来 估计 它 与 最 终 系统 的 
“近似 ”行为 。 这 一 快速 原型 的 成 本 可 以 比 最 终 系统 要 高 ， 体 积 也 可 以 比 最 终 系统 
要 大 ， 功 耗 也 可 以 大 于 最 终 系统 ， 甚 至 革 些 时 序 约束 也 可 以 放宽 ， 它 只 要 能 对 系统 
的 基本 功能 进行 评估 即 可 。 这 样 的 系统 也 可 以 用 于 对 系统 的 最 终 功 能 进行 评估 。 

2) 小 批量 应 用 : 如 果 目 标 市 场 的 预期 销量 较 小 ， 则 无 法 判断 是 否 应 该 使 用 定 
制 的 ASIC。 如 果 软 件 开 发 较 慢 或 者 效率 不 高 ， 可 编程 序 逻 辑 就 是 这 种 应 用 场景 的 
明智 选择 。 

3) 实时 系统 : 基于 FPGA 的 设计 时 序 通常 是 非常 精确 的 ， 因 此 FPGA 可 以 用 
于 实现 时 序 要 求 严 格 的 系统 。 

可 编程 序 硬件 通常 包含 随机 存 取 存储 器 (Random Access Memory, RAM), 用 
于 存储 在 硬件 正常 操作 时 所 需要 的 配置 。 这 些 RAM 通常 都 是 易 失 性 的 (Volatile) 
( 即 只 有 在 系统 上 电 后 才 会 存 取 信息 )。 因 此 ， 在 系统 上 电 时 ， 必 须 将 配置 数据 复 
制 到 配置 RAM。 类 似 只 读 存储 器 (Read-Only Memories, ROM) 与 闪存 的 永久 
( Persistent) 存储 技术 也 可 以 提供 这 些 配 置 数 据 的 存储 功能 。 

现场 可 编程 序 门 阵列 (Field Programmable Gate Arrays, FPGA) 是 使 用 最 为 广 
泛 的 可 编程 序 硬 件 。 正 如 其 名 字 所 示 ，FPGA 的 编程 是 “在 现场 ” (在 芯片 被 制造 
后 ) 进行 的 。 此 外 ， 这 些 可 编程 器 件 都 包含 着 阵列 化 的 处 理 单 元 。 图 3. 32 展示 了 
Xilinx Virtex-II 的 阵列 结构 [ Xilinx, 2007], 

最 新 的 Virtex-5 阵列 包含 了 240 x 108 个 可 配置 逻辑 模块 (Configurable Logic 
Blocks, CLB) [Xilinx，2009]。 它 们 可 以 使 用 可 编程 序 内 部 连接 结构 互 连 。 这 一 
阵列 可 以 包含 多 达 1200 个 用 户 可 定义 的 IO 连接 。 此 外 ， 它 还 包含 着 1056 个 DSP 
模块 ，DSP 模块 包含 25 x 18bit 的 乘法 器 以 及 16416 kbit 的 RAM ( 块 RAM) 。 每 个 
CLB 包含 着 两 个 slice ( 见 图 3.33). 
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图 3.32 Virtex-II FPGA 的 Floor-plan 


每 个 slice 包含 了 4 块 内 存 。 每 块 内 存 均 可 
以 被 当 作 查 找 表 (Look-Up Table, LUT) 使 用 ， 
它 可 以 实现 一 个 6 输入 的 逻辑 功能 或 者 两 个 5 输 
入 的 逻辑 功能 ， 对 应 地 可 以 实现 6 输入 的 2 与 5 
输入 的 2” 的 布尔 计算 。 在 多 路 复 用 器 的 基础 上 ， 





开关 和 矩阵 


COUT 


COUT 





slice 
(1) 











多 个 内 存 块 还 可 以 组 合 在 一 起 使 用 。 内 存 块 也 
可 以 用 作 普 通 的 RAM 或 者 是 移 位 寄存 器 (Shift 
Registers, SRL°), 。 每 个 slice 还 包含 4 个 输出 寄 
存 器 以 及 针对 快速 加 法 的 特殊 逻辑 ( 见 图 3. 34) 
[ Xilinx, 2009 ] 。 

配置 数据 决定 了 slice 中 多 路 复 用 器 的 设置 、 
寄存 器 与 RAM 的 时 钟 、RAM 模块 的 内 容 以 及 多 个 CLB 之 间 的 连接 关系 。 通常 ， 
这 些 配 置 数据 是 从 硬件 功能 的 高 层 描述 中 产生 的 ， 如 VHDL。 在 较为 理想 的 情况 
下 ， 相 同 的 硬件 描述 也 可 以 被 用 于 自动 产生 ASIC， 但 在 实践 中 ， 一 般 都 需要 人 工 
干预 这 一 工程 。 

.如 果 可 以 在 FPGA 中 使 用 处 理 器 ， 则 将 处 理 器 与 可 配置 软件 进行 集成 ， 就 会 

一 件 非 常 简单 的 事情 ， 它 们 可 以 做 成 硬 核 或 软 核 。 对 于 硬 核 ， 将 在 架 AP ARER 
域 包含 一 个 高 度 集成 的 核 ， 这 一 区 域 只 能 用 于 硬 核 ; 而 软 核 可 以 利用 标准 的 CLB 
来 进行 综合 实现 。 软 核 虽然 更 加 灵活 ， 但 它 的 效率 比 硬 核 低 。 

如 Xilinx 的 Virtex-5FXT 系列 就 包含 了 最 多 两 个 Power-PC 处 理 器 硬 核 。 

软 核 可 以 直接 在 FPGA 片上 实现 ，MicroBlaze [ Xilinx, 2008] 就 是 这 样 一 个 例子 。 




















图 3.33 Virtex-5 的 CLB 
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图 3.34 Virtex-5 的 slice (简化 图 ) 
3.4 内存 


数据 、 程 序 以 及 FPGA 的 配置 数据 都 需要 被 存储 在 某 些 内 存 中 ， 它 们 必须 以 一 
种 高 效 的 方式 存储 。 高 效 ， 则 意味 着 实时 性 、 代 码 大 小 以 及 能 耗 方面 都 更 优化 。 代 
码 大 小 需要 一 个 好 的 编码 器 支持 ， 同 时 也 可 能 需要 代码 压缩 技术 的 支持 。 设 计时 需 
要 明确 内 存 的 架构 ， 从 而 得 到 更 佳 的 实时 性 以 及 能 效 ， 其 根本 原因 是 越 大 的 内 存 就 
需要 越 高 的 功 耗 ， 同 时 它 的 访问 速度 也 比 小 内 存 慢 。 

图 3. 35 分 别 展示 了 在 将 一 块 内 存 作为 寄存 器 存储 区 域 时 ， 寄 存 器 访问 所 需要 
的 时 间 与 功 耗 以 及 内 存 大 小 的 函数 关系 [Rixner et al. , 2000], 

使 用 高 速 缓存 的 功 耗 与 时 延 可 以 使 用 CACTI [Wilton and Jouppi, 1996] 进行 
计算 ， 在 其 计算 结果 中 ， 也 会 包含 数据 RAM 区 域 的 功 耗 与 时 延 。 这 些 数 值 可 以 在 
系统 设计 中 用 于 对 通用 RAM 型 内 存 的 功 耗 与 时 延 进行 估计 。 图 3. 36 展示 了 在 不 同 
内 存 大 小 的 情况 下 ， 功 耗 与 时 延 的 函数 关系 图 [ Banakar et al ，2002] 。 

当前 的 研究 已 经 表明 ，CPU 与 内 存 的 性 能 在 近年 来 以 不 同 的 速度 在 增长 ( 见 
图 3.37) 。 
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图 3.35 寄存 器 文件 大 小 与 访问 时 间 及 功 耗 的 函数 关系 
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图 3.36 CACTI 估计 的 RAM 内 存 的 功 耗 及 时 延 图 3.37 ”处理 器 与 内 存 发 展 的 差距 





从 图 3.37 可 见 ， 内 存 的 性 能 每 年 仅 增长 1. 07 倍 ， 而 处 理 器 的 性 能 却 以 每 年 
1.5 ~2 信 的 速度 增长 [Machanik ，2002 ] 。 这 意味 着 处 理 器 与 内 存 之 间 的 性 能 差距 
越 来 越 大 。 当 然 ， 更 进一步 的 提升 处 理 器 性 能 可 能 需要 使 用 多 核 系统 (Multi-Core 
Systems ) 。 

因此 ， 在 主 内 存 与 处 理 器 之 间 使 用 较 小 的 高 速 内 存 作为 缓存 就 非常 重要 。 与 
PC 一 类 的 系统 一 样 ， 这 些 空间 较 小 的 内 存 必须 从 架构 上 来 保证 系统 的 实时 性 是 可 
预测 的 。 在 系统 中 通常 使 用 小 内 存 与 大 内 存 的 组 合 ， 其 中 的 小 内 存 保存 着 被 经 常 使 
用 数据 与 指令 ， 大 内 存 保存 着 其 他 数据 与 指令 ， 这 样 的 组 合 也 比 使 用 单一 的 大 内 存 
效率 更 高 。 如 A. Macii [ Macii et al. , 2002] 所 说 ， 在 有 些 时候 ， 也 可 以 考虑 使 用 
内 存 分 区 。 

为 了 提供 更 好 的 实时 效率 ， 也 常常 在 系统 中 使 用 缓存 。 在 图 3. 35 右 图 中 ， 可 
以 明显 地 看 出 使 用 缓存 时 提高 了 内 存 系统 的 能 效 。 对 缓存 的 访问 ， 其 实 就 是 对 小 内 
存 的 访问 ， 因 此 相 比 大 内 存 而 言 ， 它 需要 更 少 的 功 耗 。 但 是 ， 对 于 被 访问 的 地 址 ， 
硬件 需要 去 检查 缓存 中 是 否 包 含 了 被 访问 地 址 以 及 地 址 中 的 内 容 是 否 有 效 。 这 种 检 
碍 是 通过 比较 缓存 的 标识 (Tag) 区 域 中 的 相关 地 址 位 来 完成 的 【Hennessy and 
Patterson，2002 ] 。 读 取 这 些 相关 的 标识 位 都 需要 额外 的 功 耗 ， 因 此 缓存 实时 性 的 
可 预测 性 通常 也 比较 低 。 
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为 外 ， 小 内 存 可 以 被 映射 到 大 内 存 的 一 块 空间 中 ( 见 图 3. 38)。 

这 种 内 存 被 称 为 片上 存储 器 (Scratch Pad Memories, SPM) 。 使 用 频率 较 高 的 
变量 与 指令 都 被 分 配 在 这 一 地 址 空间 中 ， 它 也 不 需要 由 硬件 来 对 访问 地 址 进行 检 
查 。 因 此 ， 它 每 次 访问 的 功 耗 相对 较 低 。 图 3. 39 展示 了 在 SPM 上 的 单 次 访问 与 组 
存 中 的 单 次 访问 的 功 耗 对 比 。 

每 64btit 访 问 的 能 耗 /mJ 
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图 3.38 SPM 示意 图 图 3.39 ”片上 存储 器 与 缓存 访问 的 能 耗 对 比 


对 于 两 路 组 相关 (Two-way Set Associative) 的 缓存 ， 它 与 使 用 SPM 时 的 能 耗 
差 值 为 3。 例 子 中 计算 出 的 这 个 值 是 使 用 CACTI 缓存 评估 工具 [Wilton and Jouppi, 
1996] 对 RAM 阵列 进行 了 能 耗 估计 所 得 到 的 。 

如 采编 译 器 能 够 很 好 地 将 经 常 使 用 的 变量 放置 在 SPM 区 域 ， 则 SPM 就 可 以 使 
内 存 访 问 具 有 更 高 的 可 预测 性 。 


3.5 通信 


在 能 人 式 系统 中 ， 要 实现 对 信息 的 处 理 ， 则 首先 要 准备 好 信息 内 容 。 信 息 通过 
不 同 的 信道 〈Channels) 进行 传输 与 通信 。 与 通信 系统 的 最 大 信息 传输 能 力 以 及 品 
声 等 参数 一 样 ， 信 道 是 通信 系统 属性 的 一 种 抽象 。 使 用 通信 理论 技术 ， 也 可 以 计算 
出 可 能 的 通信 和 错误。 通信 中 使 用 的 物理 介质 被 称 为 介质 (Media) 。 重 要 的 通信 介 
MA: 无 线 介 质 (射频 、 红 外 )、 光 学 介质 (光纤) 、 导 线 等 。 

各 种 不 同类 型 的 戏 人 式 系统 也 需要 多 种 多 样 的 通信 方式 。 通 常 ， 连 接 不 同 的 所 
和信 式 硬件 模块 是 非常 重要 的 问题 ， 可 以 对 一 些 通用 的 需求 展开 讨论 。 


3.5.1 需求 


下 面 列举 了 一 些 必须 满足 的 需求 : 

1) 实时 性 : 这 一 需求 对 通信 系统 的 设计 有 着 深远 的 影响 。 例 如 ， 像 以 太 网 
(Ethernet) 一 类 低 成 本 的 解决 方案 就 不 能 满足 这 一 需求 。 

2) 效率 : 连接 不 同 的 硬件 模块 的 成 本 可 能 会 非常 高 晶 。 举 例 来 说 ， 大 型 建筑 
之 间 点 到 点 的 连接 几乎 是 不 可 能 的 。 当 前 已 经 发 现 ， 在 汽车 的 控制 单元 与 外 部 设备 











第 3 章 BRAN AAI 115 





之 间 使 用 单独 的 导线 将 会 明显 增加 汽车 的 成 本 以 及 整 车 重量 。 使 用 单独 的 导线 ， 也 
将 导致 很 难 再 添加 新 的 元 件 。 提 供 低 成 本 设计 的 需求 也 同样 影响 着 电力 向 外 部 设备 
供给 的 方式 。 通 常 ， 在 汽车 中 都 会 使 用 一 个 集成 化 的 供电 模块 来 降低 成 本 。 

3) 合理 的 带宽 以 及 通信 延 时 : 艇 入 式 系统 对 带宽 的 要 求 各 不 一 样 ; 一 方面 要 
提供 足够 的 通信 带宽 ; 另 一 方面 也 不 会 导致 通信 系统 成 本 过 高 ， 这 是 非常 重要 的 。 

4) 支持 事件 驱动 型 通信 : 轮 循 系统 提供 了 可 预测 的 实时 系统 行为 ， 但 是 它们 
的 通信 延 时 可 能 会 非常 大 。 出 于 对 快速 基于 事件 通信 的 需求 ， 如 一 些 紧 急 信息 可 能 
需要 立即 通信 ， 它 们 不 可 能 等 待 核心 控制 器 来 读 取 这 些 信 息 。 

5) 健壮 性 : 信息 一 物理 系统 可 能 被 用 于 某 些 极端 的 温度 ， 也 可 能 靠近 大 量 的 
电磁 辐射 源 等 。 如 汽车 引擎 ， 它 可 能 工作 在 -20 ~ 180 ( -4~356°F) 的 温度 
下 。 剧 烈 的 温度 变化 会 影响 电压 的 线性 度 以 及 时 钟 频率 的 稳定 性 ， 同 时 也 会 影响 通 
信 的 稳定 性 。 

6) 容错 : 即使 在 系统 的 健壮 性 设计 方面 付出 全 部 努力 ， 系 统 仍然 可 能 会 产生 
错误 。 在 系统 发 生 错误 后 ， 信 息 一 物理 系统 应 尽 可 能 继续 工作 。 在 PC 中 使 用 的 重 
局 ， 在 信息 一 物理 系统 中 ， 不 可 能 在 故障 发 生 时 采用 像 PC 一 样 立 即 重启 ， 这 是 不 
可 接受 的 。 这 意味 着 在 通信 失败 时 就 需要 进行 重 传 。 这 就 与 第 一 项 需求 产生 了 矛 
J: 如 果 人 允许 重 传 ， 则 满足 实时 需求 可 能 会 比较 困难 。 

7) 可 维护 性 与 可 诊断 性 : 非常 明显 ， 在 有 限 的 时 间 内 修复 嵌入 式 系统 也 非常 
重要 。 

8) 隐私 保护 : 保密 信息 可 能 需要 使 用 加 密 方 式 进行 传输 。 

这 些 通信 系统 的 需求 ， 其 实 也 是 在 第 1 章 中 提 到 的 散人 式 /信息 一 物理 系统 一 般 
属性 的 直接 描述 。 这 些 需求 之 间 可 能 存在 着 冲突 ， 因 此 需要 使 用 一 些 折 中 方案 。 如 这 
些 不 同 的 通信 模式 : 一 个 具有 高 速 带宽 的 实时 系统 ， 同 时 也 没有 容错 机 制 (这 种 模 
式 适 合用 于 流 媒 体 ) 的 系统 ; 一 个 不 可 以 丢弃 短 消息 的 有 容错 机 制 的 低 带 宽 系统 。 


3.5.2 电气 健壮 性 
对 于 电气 健壮 性 的 设计 有 许多 种 技术 。 芯 片 内 部 的 数字 通信 一 般 都 使 用 一 种 被 
PKA Him (Single-ended) 的 信号 。 对 于 单 端 信号 ， 信 和 号 在 单一 的 导线 上 进行 传输 

( 见 图 3.40) 。 
单 端 输出 PM 标准 输入 L [1.. 






































地 





图 3.40 单 端 信号 ` 


这 样 的 信号 都 使 用 一 个 以 公共 地 为 参考 的 电压 信号 来 表达 (有 少数 时 候 也 使 
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用 电流 ) 。 对 于 多 个 单 端 信 号 ， 使 用 单一 地 线 即 可 。 单 端 信和 号 容易 受到 外 部 噪声 的 
污染 。 如 果 外 部 噪声 〈 如 来 自 电 动机 的 开关 噪声 ) 影响 了 信号 电压 ， 则 可 能 会 破 
坏 传输 的 消息 。 同 时 ， 由 于 地 线 之 间 的 阻抗 〈( 以 及 感 抗 ) ， 在 有 多 个 节点 的 通信 系 
统 中 很 难 建立 一 个 高 质量 的 共 模 地 。 这 与 差分 信号 的 情况 又 不 一 样 : 对 于 差分 信 
号 ， 每 个 信号 都 需要 两 条 线 (SLA 3. 41)。 


几 门 ， 差 分 输出 tt 比较 器 mo.. 





图 3.41 差分 信号 


使 用 差分 信号 ， 二 进 制 数值 按 如 下 规则 进行 编码 : 如 果 第 一 根 线 上 的 电压 相对 
于 第 二 根 线 是 正极 性 的 ， 则 它 的 编码 为 1" ， 否 则 它 被 编码 成 '0' 。 这 两 条 线 通常 
绞 在 一 起 ， 称 为 双 绞 线 (Twisted Pairs) 。 这 两 条 线 都 可 以 共同 使 用 局 部 地 信和 号 ， 
非 零 的 局 部 地 信号 并 不 会 对 系统 带 来 负面 影响 。 差 分 信号 的 优点 还 包括 : 

1) 噪声 将 以 同样 的 方式 影响 差分 信号 的 两 条 传输 线 ， 但 比较 器 会 去 除 几 乎 所 
有 的 噪声 。 

2) 比较 器 的 逻辑 输出 仅 与 两 根 线 之 间 的 相对 电压 极 性 相关 。 电 压 的 幅度 可 能 
会 受信 号 反射 以 及 两 条 线 之 间 阻 抗 的 影响 ， 但 它 不 会 影响 到 最 后 的 编码 结果 。 

3) 由 于 信号 不 会 在 地 线 上 产生 任何 电流 ， 因 此 地 线 的 质量 不 是 非常 重要 。 

4) 由 于 不 需要 在 多 个 通信 节点 之 间 建 立 一 个 高 质量 的 参考 地 ， 因 此 不 需要 共 
模 地 线 (这 也 就 是 Ethernet 的 传输 使 用 差分 信号 的 原因 ) 。 

5) 由 上 面 列举 的 诸多 关于 差分 信号 的 属性 ， 使 用 差分 信号 时 的 数据 吞吐 量 可 
以 比 单 端 信号 更 大 。 

但 是 ， 差 分 信号 都 需要 两 条 线 ， 并 且 它 同时 还 需要 负电 压 (除非 它 基 于 有 补 
充 逻 辑 信息 的 单 端 信号 电压 ) 。 

差分 信号 已 经 被 广泛 使 用 ， 如 在 标准 的 基于 Ethernet 的 网 络 中 。 


3.5.3 实时 性 的 保证 


对 于 内 部 通信 ， 系 统 可 以 使 用 点 到 点 (Point-to-Point) 通信 或 者 共享 总 线 通 
信 。 点 到 点 通信 可 以 做 到 很 好 的 实时 性 ， 但 可 能 会 需要 较 多 的 连接 ， 同 时 在 接收 端 
可 能 会 有 较 多 的 冲突 。 对 于 共享 总 线 ， 通 常 写 操作 更 容易 。 典 型 地 ， 如 果 多 个 发 起 
者 都 请 求 访 问 同一 介质 (参考 如 [Hennessy and Patterson, 2002 ] ) ， 这 些 总 线 一 般 
使 用 基于 优先 级 的 仲裁 方式 。 由 于 在 设计 阶段 很 难 去 估计 系统 中 的 冲突 ， 这 种 基于 
优先 级 的 仲裁 方式 就 比较 缺乏 时 序 的 可 预测 性 。 它 有 时 还 会 导致 “饥饿 ”( 低 优先 
级 的 通信 一 直 被 高 优先 级 的 通信 阻塞 ) 。 为 了 解决 这 类 问题 ， 可 以 使 用 时 分 多 址 
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(Time Division Multiple Access, TDMA) 技术 。 在 TDMA 调度 中 ， 每 个 节点 都 被 分 
配 一 个 固定 的 时 隙 (Time Slot) 。 通 信 时 间 通 常 被 分 为 帧 ， 每 个 帧 都 有 一 些 时 隙 用 
于 帧 同步 ， 同 时 它 也 允许 发 送 端 在 某 些 时 隙 关闭 通信 ( 见 图 3.42 [ Koopman and 
Upender, 1995 | )。 i 


< - 帧 周期 > 


A 帧 同步 帧 间隔 Slice 0 Slice 1 | ne Slice n—1 
Wy H sh 监听 
消息 与 间隔 时 间 


k isie ——> 


图 3.42 基于 TDMA 的 通信 











帧 同步 























消息 间隙 的 后 面 还 有 许多 的 时 间 片 ， 它 们 都 可 以 用 于 消息 通信 。 考 虑 到 参与 通 
信 的 各 个 节点 可 能 有 不 同 的 时 钟 频率 ， 每 个 时 间 片 也 包含 一 些 间 院 以 及 监听 时 间 ， 
时 间 片 被 分 配给 不 同 的 通信 节点 。 这 种 调度 方式 有 许多 变异 ， 如 可 以 将 某 些 未 使 用 
的 时 间 片 去 掉 ， 或 者 在 保证 所 有 节点 带宽 的 前 提 下 为 一 个 节点 分 配 多 个 时 间 片 。 这 
种 调度 方式 可 以 避免 饥饿 。ARM 使 用 的 AMBA-bus [ARM Ltd. , 2009a] 就 包含 着 
基于 TDMA 的 总 线 分 配 模 型 。 

计算 机 之 间 的 通信 通常 都 是 基于 Ethernet 标准 的 。 对 于 10 Mbit/s 与 100 Mbit/s 
版 本 的 Ethernet， 多 个 通信 节点 之 间 可 能 会 存在 冲突 。 也 就 是 说 ， 多 个 节点 可 能 在 
同一 时 刻 发 起 通信 ， 导 线 上 的 信号 可 能 会 恶化 。 只 要 这 种 情况 一 发 生 ， 所 有 的 发 送 
端 都 必须 马上 停止 通信 ， 等 待 段 时 间 再 进行 重 传 。 这 个 等 待 时 间 是 随机 选择 的 ， 
从 而 使 下 一 次 的 传输 尝试 不 至 于 再 产生 新 的 冲突 。 这 种 方式 被 称 为 载波 监听 多 路 访 
问 / 冲 突 检 测 (Carrier-Sense Multiple Access/Collision Detect，CSMA/CD)。 对 于 CS- 
MA/ZCD， 可 能 会 存在 很 小 的 机 率 使 通信 时 的 冲突 在 很 长 一 个 时 间 一 直 存 在 ， 从 而 
导致 通信 延 时 变 得 非常 大 。 因 此 ，CSMA/CD 不 能 用 于 需要 满足 实时 性 约束 的 
系统 。 

这 个 问题 可 以 使 用 载波 监听 多 路 访问 /冲突 避免 (Carrier-Sense Multiple Access/ 
Collision Avoidance, CSMA/CA) 。 正 如 其 名 称 所 示 ， 冲 突 可 以 被 完全 避免 ， 而 不 
仅仅 是 侦 测 。 对 于 CSMAZCA ， 所 有 节点 都 被 分 配 了 优先 级 。 在 仲裁 阶段 (Arbitra- 
tion Phases) ， 根 据 通信 的 不 同 阶段 ， 通 信介 质 被 分 配给 各 个 通信 节点 。 在 仲裁 阶 
段 ， 准 备 传输 数据 的 通信 节点 都 需要 在 介质 上 出 示 其 优先 级 标识 ， 而 后 移 除 高 优先 
级 节点 的 优先 级 标识 。 
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为 了 保证 这 一 点 ， 在 仲裁 阶段 必须 有 一 个 时 间 上 限 ，CSMAZCA 将 保证 具有 高 
优先 级 的 节点 能 进行 可 预测 的 实时 传输 。 对 于 其 他 节点 ， 如 果 更 高 优先 级 的 节点 对 
通信 介质 不 是 连续 访问 的 ， 则 其 实时 性 也 可 以 得 到 保证 。 

值得 注意 的 是 ， 高 速 版 本 的 Ethernet (> 1 Gbit/s) 同样 也 可 以 避免 冲突 。TD- 
MA 调度 同样 可 以 用 于 无 线 通信 系统 中 ， 学 例如 于 机 中 也 使 用 一 一 些 TDMA 机 制 来 进 
行 通信 ， 如 GSM, 


3.5.4 例子 


1. 传感器 /执行 器 总 线 

传感器 /执行 器 总 线 在 诸如 开关 、 灯 具 以 及 一 些 处 理 设备 之 间 提供 了 通信 机 制 。 
有 许多 这 样 的 设备 ， 它 们 之 间 的 总 线 的 布线 成 本 必须 要 额外 加 以 考虑 。 

2. 现场 总 线 

现场 总 线 与 传感器 /执行 器 总 线 相似 。 通 常 ， 它 们 比 传感器 /执行 器 总 线 能 够 提 
供 更 快 的 数据 速率 。 现 场 总 线 的 例子 如 下 : 

1) 控制 器 局 域 网 (Controller Area Network, CAN); 为 了 连接 控制 器 及 其 外 
设 ，Bosch 与 Intel 公司 在 1981 年 开发 了 CAN 总 线 。 由 于 CAN 可 以 将 许多 电缆 连 
接 的 通信 系统 用 单一 总 线 替 代 ， 因 此 它 在 汽车 工业 领域 得 到 了 非常 广泛 的 应 用 。 由 
于 汽车 市 场 的 规模 较 大 ， 因 此 CAN 模块 都 相对 比较 便宜 ， 它 也 被 用 于 其 他 一 些 领 
域 ， 如 智能 家 居 以 及 制造 设备 。CAN 总 线 有 如 下 一 些 特性 : 

D 使 用 双 绞 线 差分 传输 ; 

@ 基于 CSMA/CA 的 仲裁 ; 

© 吞吐 率 为 10kbit/s ~1 Mbit/s; 

@O 消息 分 为 高 优先 级 与 低 优先 级 ; 

O 对 于 高 优先 级 消息 最 大 时 延 为 134hus; 

© 消息 编码 与 PC 上 的 串口 (RS-232) 相似 ， 都 针对 差分 信号 进行 了 修改 。 
基于 CSMA/CA 的 仲裁 不 能 防止 饥 俄 ，CAN 协议 也 继承 了 这 一 缺点 。 

2) 时 间 触 发 协议 (Time-Triggered-Protocol， TIP) [ Kopetz and Grunsteidl, 
1994] 用 于 要 求 高 安全 性 的 容错 系统 中 ， 如 汽车 中 的 安全 气 吉 。 

3) FlexRay ™[ F lexRay Consortium, 2002] 是 一 种 TDMA 协议 ， 它 由 FlexRay 
协会 (BMW, DaimlerChrysler, General Motors, F ord, Bosch, Motorola 以 及 Philips 
Semiconductors) 开发 。FlexRay 是 TTP 以 及 Byteflight [ Byteflight Consortium, 2003 ] 
的 组 合 变异 协议 。 

FlexRay 有 静态 以 及 动态 的 仲裁 阶段 。 苦 态 仲裁 阶段 使 用 类 似 TDMA 的 仲裁 调 
度 ， 它 可 以 用 于 实时 通信 并 且 可 以 避免 饥 钱 ， 动态 仲裁 可 以 为 非 实 时 通信 提供 较 好 
的 带宽 保证 。 出 于 容错 的 考虑 ， 通 信 节 点 可 以 被 连接 到 至 多 两 个 总 线 。 总 线 监护 
(Bus Guardians) 可 以 保护 节点 免 受 其 他 节点 大 量 元 余 消 息 的 影响 ， 这 种 节点 发 送 
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大 量 无 用 信息 的 现象 被 称 为 babbling idiots 。 节 点 可 以 使 用 它们 自己 独立 的 时 钟 周 
期 ， 但 所 有 节点 的 时 钟 周期 应 该 互 为 位 数 关系 。 分 配给 节点 用 于 通信 的 时 隙 也 正 是 
基于 这 些 具 有 一 定 共性 的 时 钟 周 期 。 

Levi 仿真 软件 允许 在 实验 室 条 件 下 对 此 协议 进行 仿真 [Sirocic and Marwedel, 
2007a | 。 

4) LIN (Local Interconnect Network ， 本 地 互连网 络 ) 是 在 汽车 领域 连接 传感器 
与 执行 器 的 一 种 低 成 本 通信 标准 [LIN Administration, 2010] 。 

5) MAP: MAP 是 专 为 汽车 工厂 设计 的 一 种 总 线 。 

6) EIB: EIB (European Installation Bus， 欧 洲 安 装 总 线 ) 是 为 智能 家 居 设 计 
的 一 种 总 线 。 

3. 有 线 多 媒体 通信 (Wired Multimedia Communication) 

对 于 有 线 多 媒体 通信 ， 一 般 都 需要 较 高 的 数据 传输 速率 。 如 MOST (Media Ori- 
ented Systems Transport， 面 向 媒体 的 系统 传输 ) 就 是 汽车 领域 中 用 于 多 媒体 及 娱乐 
设备 的 通信 标准 [MOST Cooperation ，2010] 。 如 相 线 接口 IEEE 1394 也 可 以 用 于 相 
同 的 目的 。 

4. 无 线 通 信 (Wireless Communication) 

无 线 通信 方式 正 变 得 越 来 越 流 行 。 当 前 (2010 年 ) 使 用 HSPA ( High Speed 
Packet Access， 高 速 分 组 接 人 ) 可 以 很 容易 得 到 7 Mbit/s 的 速率 ， 甚 至 更 高 速 的 通 
信也 即将 达到 [ 如 长 期 演进 (LongTerm Evolution, LTE) 技术 ] 。 

蓝牙 是 连接 诸如 智能 手机 与 手持 设备 之 间 的 一 种 通信 标准 。 

无 线 Ethernet 的 IEEE 标准 版 本 是 802. 11 ， 它 已 经 用 在 了 本 地 局 域 网 中 (Local 
Area Networks, LAN) 。 

DECT 是 欧洲 无 线 手机 的 标准 。 


3.6 输出 


和 对 人 式 /信息 一 物理 系统 的 输出 设备 通常 包括 : 

1) 显示 设备 : 显示 技术 也 是 一 个 非常 重要 的 领域 。 相 应 地 ， 关 于 显示 技术 也 
有 大 量 的 相关 信息 [Society for Display Technology，2003 ] 。 在 显示 技术 的 最 新 研究 
与 发 展 上 ， 当 前 最 主要 的 是 有 机 显示 技术 [ Gelsen，2003 ] 。 有 机 显示 是 主动 发 光 
的 ， 它 可 以 制造 得 非常 轻薄 。 与 LCD 显示 不 同 ， 它 不 再 需要 背光 与 偏振 滤波 器 。 
当前 有 机 显示 技术 的 市 场 有 很 广阔 的 发 展 前 景 。 

2) 机 电 设 备 : 通过 电动 机 或 其 他 一 些 机 电 设备 ， 可 以 对 运行 环境 产生 影响 。 

在 实际 系统 中 通常 会 同时 使 用 到 模拟 与 数字 输出 。 在 模拟 输出 设备 中 ， 数 字 信 
息 需 要 首先 通过 D-A 转换 器 转换 为 模拟 量 。 可 以 在 嵌 人 式 系统 的 模拟 输入 至 输出 
路 径 中 ， 找 到 这 一 转换 器 。 图 3. 43 展示 了 信号 在 整个 流程 中 的 变化 ， 各 个 方 框 表 
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示 的 功能 与 目的 将 会 在 接 下 来 的 内 容 进行 介绍 。 


-二 | 搞 混 和 = arene Ft a 本 na |] 有 E wa H 
E =| = ae a 


图 3.43 信号 从 模拟 输入 到 输出 的 系列 转换 
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3.6.1 D-A 转换 器 
D-A 转换 器 并 不 复杂 。 图 3. 44 展示 了 一 个 被 称 为 权 电 阻 型 的 简单 D-A 转换 













































电路 。 
转换 器 的 关键 点 是 首先 根据 数字 信号 x 的 值 产生 相应 的 电流 信和 号。 但 由 于 电流 

信和 号 在 后 续 系统 中 处 理 时 并 不 方便 ， x abo 

因此 电流 又 被 转换 成 相应 的 电压 y。 = =E 

这 种 转换 是 通过 一 个 运算 放大 器 » aT 

( 即 图 3. 44 中 的 三 角形 符号 ) 来 完 ees ee \? 

成 的 。 关 于 运算 放大 器 的 特征 等 ， Ch E ee 


在 本 书 的 附录 B 中 进行 了 描述 。 

那么 ， 如 何 来 计算 输出 电压 y 
呢 ? 首先 ， 需 要 考虑 图 3. 44 虚线 表 
示 的 回路 的 意义 。 数 字 信和 号 * 为 "0 ， 则 通过 电阻 的 电流 也 将 为 零 ; 如 果 数 字 信 号 
“为 "1 ， 则 电流 将 由 每 个 数字 信号 的 位 表示 的 权重 以 及 电路 中 选取 的 电阻 来 共同 
决定 。 对 此 回路 使 用 基 尔 霍 夫 回路 定理 (Kirchhoffs Loop Rule) (参见 附录 B), 
使 用 x 来 表示 x 的 最 低位 ， 于 是 有 

xo l8 R+V -Ve=0 (3: 17) 

V KANO (参见 附录 B) ， 因 此 有 

Vw 
“SHR 

公式 中 的 站 ~ 1, 是 通过 其 相应 电阻 的 电流 值 。 现 在 可 以 基于 基 尔 霍 夫 回路 定理 
(参见 附录 B) 对 连接 了 所 有 电阻 的 电路 节点 进行 分 析 。 在 某 个 电路 节点 ， 所 有 输 
出 的 电流 值 必须 与 输入 节点 的 电流 值 相 等 ， 因 此 有 


图 3.44 D-A 转换 电路 











(3. 18) 


1o = xo 





foro panty (3. 19) 
are Vet pet See 
R 2R 1 4*R O'S eR 
Vef : i-3 
= dm #2 (3. 20) 


PLM URLS R, y 与 V_ 的 回路 应 用 基 尔 霍 夫 回 路 定理 。 由 于 VV_ 约 等 于 0， 
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因此 有 
y+R,*71 =0 (3.21) 
接 下 来 ， 可 以 对 连接 着 人 、 了 以 及 运算 放大 器 的 反 向 输入 端 应 用 基 尔 霍 夫 回路 
定理 。 放 大 器 反 向 输入 端的 电流 可 以 认为 是 零 ， 于 是 电流 了 = 也 ， 因 此 有 





y +R, *IT=0 (3.22) 
从 式 (3.20) 与 式 (3.22), ， 可 以 得 到 
R 2 R 
Ve Seri Dy mi #2 = — Vor # eg nat 2) (3.23) 
AP nat 一 一 数字 信号 x 的 自然 数 。 


很 显然 ，y 是 相应 于 x 的 数值 。 如 果 需 要 将 输出 电压 全 部 转 为 正 向 ， 或 者 要 将 
输出 结果 进行 位 翻转 ， 只 需要 对 电路 进行 很 小 的 扩展 即 可 。 

从 DSP 的 观点 来 看 ，y (1t) 是 一 个 离散 时 域 上 的 信号: 它 提供 了 一 个 在 离散 
时 间 上 的 电压 值 序列 (Sequence) 。 在 工程 实践 中 ， 由 于 在 更 多 时 候 都 是 观察 图 
3. 44 电路 的 连续 输出 ， 这 样 的 y(t) 利用 起 来 会 非常 不 方便 。 因 此 ，D-A 转换 器 
通常 还 扩展 出 了 “ 零 阶 保持 ”功能 (“Zero-order Hold” Functionality ) 。 这 意味 着 转 
换 右 将 在 下 一 个 值得 到 转换 前 ， 一 直 保 持 着 前 一 个 值 。 事 实 上 ， 在 图 3. 44 所 示 的 
电路 中 ， 如 果 在 下 一 个 离散 时 间 点 之 前 不 去 改变 开关 的 位 置 ， 则 它 就 能 实现 对 前 一 
次 转换 的 保持 。 因 此 ， 转 换 器 的 输出 是 相应 于 序列 yC) 的 阶梯 函数 y'(1)。y'(t) 
是 连续 时 域 中 的 函数 。 

在 例子 中 ， 考 虑 根据 式 (3.3) 得 出 的 转换 输出 结果 ， 假 定 每 个 极 性 的 转换 各 
有 8 个 步骤 。 对 于 这 个 场景 ， 由 于 y'(t) 更 容易 观察 ， 于 是 在 图 3. 45 中 使 用 y(t) 
BAR yC) o 



























































图 3.45 根据 在 整数 时 间 点 采样 的 5 (2) [SR (3.3)] 产 生 的 阶梯 函数 y(t) 


D-A 转换 融 人 允许 将 在 时 域 上 与 数值 均 离散 的 信号 ， 转 换 为 在 时 域 上 与 数值 均 连 
续 的 信号 。 但 是 ,无 论 是 y(t) 还 是 y'(1) ,它们 都 不 能 反映 出 被 采样 信号 的 原始 
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情况 。 
3.6.2 采样 定理 


假定 在 硬件 回路 中 使 用 的 处 理 器 会 将 来 自 A-D 转换 器 的 值 不 加 改变 地 送 给 
D-A 转换 器 ， 期 待 着 将 信号 x(t) 存储 在 一 张 CD 上 ， 而 后 由 它 来 产生 完美 的 模拟 
音频 信号 。 那 么 ， 有 没有 可 能 通过 D-A 转换 器 来 重 构 出 原始 的 模拟 信号 电压 elt) 
( 见 图 3.8、 图 3.20、 图 3.43) W? RAT, WREE TERRESTRE 
象 ”， 则 不 可 能 重 构 出 原始 的 信号 。 因 此 ， 规 定 采集 速率 大 于 给 定 输入 信号 中 最 大 
正弦 波 频 率 的 两 倍 [采样 定理 ， 参 考 式 3.8] 。 是 不 是 只 要 满足 了 采样 定理 ， 就 可 
以 重 构 出 原始 信号 了 呢 ? 下 面 作 更 进一步 的 分 析 。 

向 D-A 转换 器 输入 一 离散 序列 的 数值 时 ， 它 将 产生 一 个 连续 的 模拟 值 序列 。 
在 两 个 采样 时 刻 之 间 ，D-A 转换 器 并 不 会 产生 输出 结果 ， 简 单 的 零 阶 保持 功能 
(如 果 有 ) 将 仅 会 产生 阶梯 函数 。 这 意味 着 为 了 重 构 信 号 e (1) ， 就 需要 无 限 大 的 
采样 速率 ， 因 为 只 有 这 样 ， 所 有 的 瞬时 值 才能 被 捕捉 到 。 但 是 ， 也 有 许多 很 好 的 插 
值 算法 ， 可 以 在 当前 的 采样 值 及 前 一 次 采样 值 之 间 插 人 更 多 数值 ， 从 而 使 输出 更 逼 
近 原始 函数 。 采 样 定律 [Oppenheim et al. , 2009] 告诉 我 们 ， 一 个 连续 信号 z (1) 
可 以 从 模拟 数值 序列 y (t) 进行 重 构 。 

假定 {4},，s=…，-1, 0,， 1，2,… 是 对 输入 信号 的 采样 时 刻 集合 ， 采 样 频 


FARAS, s OVS Pe Ht -二 )。 根 据 采 样 定律 ， 可 以 从 y (0) 中 来 估计 出 
e(t), WTAE: 


A y(t,)sin (th) 
g(t) = : 
之 t-t,) 

上 式 即 广为人知 的 香农 一 惠 特 克 插值 (Shannon-Whittaker Interpolation) 定理 。 
y(t.) 是 信号 y 在 采样 时 刻 i, 的 采样 值 。 随 着 后 期 的 采样 时 刻 1 远离 采样 时 刻 1,，y 
(1,) 对 时 刻 的 采样 值 影响 越 来 越 小 。 这 种 影响 的 降低 遵循 一 个 加 权 因 子 ， 即 人 
们 所 知 的 sine 函数 : 


(3.24) 








sin( (1 -1,)} 
sinc(t -t,) = = (3. 25) 
= (t-1,) 
Ps 


ASRS I t-t l 一 样 ， 是 单调 递减 的 。 加 权 因 子 用 于 计算 在 两 个 采样 点 








O ”事实 上 ， 如 果 有 关于 信号 的 其 他 附加 信息 ， 则 完整 的 重 构 信 号 也 是 可 能 的 。 例 如 ， 如 果 这 是 一 种 
特定 的 信号 类 型 。 
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之 间 的 数值 。 图 3. 46 展示 了 对 于 p, =1 时 的 加 权 因 子 。 


1 





0.8 F 














图 3.46 st (3.25) 用 于 插值 计算 的 视图 





使 用 sine 函数 ， 可 以 计算 出 式 (3.24) 中 相应 的 和 值 。 图 3. 47 与 图 3. 48 展示 
TH elt) =e3(t) 时 ,使 用 相同 的 函数 (x(1) = w(t) ) 进 行 处 理 的 结果 。 


1.5 


























图 3.48 y' (G) CER) 与 式 (3.24) 的 最 后 三 项 非 零 结果 


在 每 个 采样 时 刻 i;。( 在 这 里 的 例子 中 只 有 使 用 整数 时 间 ) ， 因 为 对 于 其 他 采样 
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时 刻 sine 均 为 零 ， 于 是 由 y(t,〉 可 以 计算 出 相应 的 z(i,)。 在 两 个 采样 时 刻 之 间 ， 
所 有 的 邻近 离散 值 都 对 结果 z(t) 有 影响 。 图 3. 49 RRTM elt) =e,(t) 时 , 使 用 
相同 的 函数 (x(t) = w(t) ) 时 的 结果 z(1)。 


1.5 


















































图 3.49 e(t) (HR), z(t) (RR) UK y) (虚线 ) 


图 3. 49 中 包含 着 信号 e(t) (RA), z(t) RA), 以 及 y'(1) (虚线 )。 
zt 已 经 考虑 了 在 图 3. 47 以 及 图 3. 48 中 所 有 采样 点 的 影响 。e;(t) 与 z(t1) 非常 
相似 。 

那么 ,使 用 式 (3.24) 怎样 才能 得 到 与 原始 输入 信号 最 相近 的 信号 呢 ? 采样 
定理 告诉 人 们 〈 参 考 如 [Oppenheim et al. ，2009 ] ) ， 如 果 满 足 了 采样 定理 [R 
(3.8) ] ， 则 使 用 式 (3.24) 可 以 计算 出 非常 精确 的 估计 值 。 因 此 ， 将 分 析 如 何 使 
FAK (3. 24)。 

在 电子 系统 中 如 何 计 算式 (3.24) We? 由 于 式 (3.24) 将 产生 连续 信号 ， 因 
此 使 用 数字 信号 处 理 器 并 不 能 在 离散 系统 中 对 它 进行 计算 。 使 用 模拟 电路 来 对 此 复 
杂 的 公式 进行 计算 ， 看 起 来 也 是 非常 困难 的 事情 。 

幸运 的 是 ， 所 要 进行 的 计算 是 在 信号 y(t) 与 sinc 函数 之 间 的 操作 ， 也 被 称 为 
HÆRE (Folding Operation) 。 根 据 经 典 的 傅 里 叶 变换 理论 ， 时 域 中 的 折 和 至 操作 与 
频 域 中 基于 频率 的 滤波 函数 的 乘法 是 等 价 的 。 这 里 的 滤波 函数 是 时 域 中 相应 函数 的 
傅 里 叶 变 换 。 因 此 ， 可 以 使 用 一 些 适 当 的 滤波 器 来 对 式 (3.24) 进行 计算 。 图 
3. 50 展示 了 滤波 器 的 相应 位 置 。 








~ ~ 
LS => 
= = 















图 3.50 信号 e(t) 转换 为 模拟 量 再 到 数字 量 再 转换 为 模拟 量 


那么 剩 下 的 问题 是 哪 一 种 基于 频率 的 滤波 函数 是 sinc 函数 的 传 里 叶 变换 ? 使 
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用 一 个 低 通 滤波 器 来 计算 sinc 函数 的 健 里 叶 变 换 [ Oppenheim et al. , 2009], 
此 ， 为 了 计算 式 〈3. 24) ， 要 做 的 “全 部 ”工作 就 是 让 信和 号 yO) 通过 一 个 低 通 滤 
波 器 ， 在 图 3. 51 中 展示 了 “理想 滤波 器 ”的 滤波 频率 。 函 数 y(t) 作为 多 个 正弦 
波 的 和 ， 即 使 假如 在 输入 端 加 上 了 抗 混和 至 滤波 器 ， 它 仍 将 含有 部 分 高 频 成 分 ， 滤 波 
fit Bh ee AA CARTE 

还 有 一 个 问题 : 理想 的 低 通 滤波 
天 是 不 存在 的 。 因 此 ， 必 须根 据 滤波 器 的 
特性 进行 折 中 考虑 。 事 实 上 ， 需 要 许多 仍 
然 有 缺陷 的 方式 来 保持 最 大 限度 的 可 以 对 
输入 信号 进行 重 构 : 

1) 理想 的 低 通 滤波 器 不 可 能 被 设计 
出 来 ， 因 此 必须 对 这 类 滤波 器 使 用 近似 法 。 ”图 3.51 理想 低 通 滤波 器 (虚线 ) 与 
如 何在 设计 时 进行 折 中 与 平衡 是 一 门 艺 术 。。 ”实践 中 的 低 通 江波 器 ( 实 线 ) 

(这 在 许多 领域 被 使 用 ， 如 音频 设备 ) 。 

2) 基于 同样 的 理由 ， 不 可 能 移 除 输入 频率 中 超出 奈 奎 斯 特 (Nyquist) 频率 成 
分 的 部 分 。 

3) 图 3.49 展示 了 数值 均衡 的 影响 。 正 是 由 于 数值 均衡 ，e，(1:) 在 很 多 时 候 
与 z (t) 不 一 样 。 由 A-D 转换 器 引入 的 量化 噪声 ， 在 产生 输出 时 并 不 能 被 移 除 。 
A-D 转换 器 的 输出 信号 w(t) 仍 将 受到 量化 噪声 的 影响 。 但 是 ， 量 化 噪声 并 不 会 
影响 到 来 自 采 样 保持 电路 的 输出 信号 h (1) 。 

4) 式 (3.24) 基于 多 个 在 将 来 的 采样 时 刻 的 数值 和 。 在 现实 中 ， 可 以 将 信和 号 
扩展 到 有 限 个 “将 来 的 ”采样 点 。 无 限 的 延 时 是 不 可 能 得 到 的 。 在 图 3.49 中 ， 就 
并 没有 考虑 图 形 之 外 采样 点 的 影响 。 

低 通 滤波 器 的 功能 是 由 模拟 电路 实现 的 : 由 于 离散 时 间 与 数值 的 固有 限制 ， 在 
数字 域 是 不 能 实现 这 种 模拟 滤波 器 的 功能 的 。 

许多 的 学 者 都 在 采样 理论 方面 有 所 研究 ， 因 此 有 许多 人 与 采样 定理 相关 。 这 些 
学 者 ， 如 Shannon, Whittaker, Kotelnikov, Nyquist, Kiipfmiiller 等 。 因 为 无 法 将 如 
此 多 的 人 与 一 个 定理 都 联系 起 来 ， 因 此 把 将 信号 进行 重 构 的 理论 统一 称 为 采样 
定理 。 


3.6.3 执行 器 


现实 中 有 大 量 的 执行 器 [Elsevier B. V. ，2010a] ， 从 大 到 可 以 搬运 数 吨 重量 的 
执行 器 ， 小 到 集成 在 pm 面积 内 的 执行 器 ， 如 图 3. 52 所 示 。 

对 于 执行 器 进行 全 面 介 绍 比较 困难 。 此 处 来 看 在 未 来 会 越 来 越 重 要 的 一 种 特殊 
执行 器 : 微 系统 技术 使 更 小 的 执行 器 制造 成 为 可 能 ， 而 这 种 微小 的 执行 器 甚至 可 以 
被 植 和 人 到 人 体内 。 











126 RAK RRR 





嵌入 式 信 息 物 理 系统 基础 ( 原 书 第 2 版 ) 





图 3.52 基于 微 系统 技术 的 执行 器 电动 机 
[ (Courtesy E. Obermeier, MAT, TU Berlin), © TU Berlin | 
使 用 这 种 微小 的 执行 器 ， 药 物 可 以 根据 人 体 的 病因 进行 相应 的 动作 ， 提 供 更 好 
的 诊断 与 治疗 方式 。 图 3. 52 展示 了 使 用 微 系统 制造 的 一 个 微小 的 电动 机 ， 它 集成 
在 一 块 am 级 的 区 域 上 ， 它 的 转动 机 构 由 静电 来 进行 驱动 。 





3.7 安全 硬件 


舱 入 式 系统 通常 可 能 还 有 安全 方面 的 设计 需求 。 如 果 安 全 是 产品 中 的 一 个 重要 
因素 ， 则 可 能 要 有 针对 性 的 相应 开发 硬件 。 在 通信 和 与 存储 中 ， 安 全 也 是 必须 被 保证 
的 因素 [Krhovjak and Matyas，2006] 。 同 样 ， 密 钥 的 产生 也 需要 特定 的 安全 设备 。 
当前 业界 已 经 设计 了 许多 硬件 安全 组 件 ， 这 些 组 件 的 设计 目的 ， 是 为 了 防御 诸如 测 
试 供电 电流 或 者 电磁 辐射 从 而 获取 信息 ， 这 种 攻击 方式 被 称 为 边 信 道 攻击 (Side- 
channel Attacks) 。 这 些 组 件 包 含 一 些 物 理 介质 的 保护 方式 (如 屏蔽 、 加 扰 等 )。 有 
一 些 处 理 带 也 支持 加 密 与 解密 。 在 物理 安全 保护 之 外 ， 还 需要 一 些 软 件 安全 保护 ， 
当前 比较 典型 的 是 使 用 密码 学 方法 。 智 能 卡 就 是 一 种 常见 的 安全 设备 ， 它 必须 运行 
一 些 加 密 算 法 来 保证 它 的 运行 安全 。 通 常 ， 区 分 不 同等 级 的 安全 ， 以 及 区 分 “人 
侵 者 ”的 等 级 ， 在 安全 系统 中 都 非常 重要 。 关 于 安全 硬件 的 设计 技术 已 经 超出 了 
本 书 的 讨论 范围 。 有 兴趣 的 读者 可 以 参考 Gebotys [Gebotys, 2010] 的 著作 ， 以 及 
部 分 研讨 会 文章 [Clavier and Gaj, 2009], 


3.8 思考 题 


1. 建议 读者 使 用 自己 的 小 机 器 人 来 对 图 3. 14 中 展示 的 硬件 回路 进行 演示 。 机 
天 人 应 当 包 含 传感器 与 执行 器 ， 它 的 控制 程序 实现 了 完整 的 控制 回路 。 如 机 器 人 使 
用 了 光学 传感器 ， 这 样 它 就 可 以 沿 着 地 板 上 一 条 黑色 的 线 行进 。 具 体 的 实验 与 步 又 
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依赖 于 读者 所 使 用 的 机 器 人 。 

2. 为 什么 腻 入 式 系 统 的 优化 非常 重要 ? 比较 一 下 柑 入 式 系统 中 信息 处 理 能 
方面 的 相关 技术 。 

3. 假定 有 一 个 输入 信号 x*， 它 是 1.75kHz 与 2kHz 两 个 正弦 波 信和 号 的 和 。 以 
3kHz 的 采样 速率 对 x 进行 采样 ， 多 个 时 间 点 采样 后 ， 有 可 能 对 原始 信号 进行 重 构 
吗 ? 解释 一 下 你 的 答案 。 

4. 从 A-D 转换 器 产生 离散 值 : 绘制 基于 闪存 A-D 转换 器 的 电路 ， 它 的 输入 可 
以 是 双 极 性 信号 ， 其 输出 至 少 能 区 分 8 个 电压 梯度 。 

5. 比较 一 下 基 闪 存 A-D 转换 器 与 连续 比较 型 A-D 转换 器 。 假 定 想 区 分 n 个 电 
压 梯度 ， 使 用 0 标志 (0-nation) 在 图 3. 53 中 填写 它们 的 复杂 度 。 


基于 闪存 的 转换 器 | 连续 估 值 转换 器 








时 间 复 杂 度 
空间 复杂 度 














图 3.53 A-D 转换 器 的 复杂 度 


6. 假定 使 用 一 个 4bit 的 逐次 逼近 型 A-D 转换 器 。 输 入 电压 的 范围 从 中 ， <1 V 
( ="0000") 4 Vax =4.75 V (="1111")。 对 于 2.25V、3.75V 5 1. 8V 的 电压 ， 
各 需要 多 少 次 转换 ? 用 一 个 与 图 3. 12 类 似 的 图 形 来 说 明 A-D 转换 器 对 这 些 电 压 是 
如 何 进行 逐次 逼近 的 。 

7. 对 基于 闪存 A-D 转换 器 进行 扩展 ,使 其 可 以 转换 双 极 性 的 电压 信号 。 

8. 假定 在 思考 题 4 中， 使 用 一 个 正弦 波 作为 输入 信和 号， 描述 在 这 种 情况 下 的 
均衡 噪声 信号。 

9. 列 出 DSP 的 特性 。 

10. FPGA 包含 着 哪些 模块 ?在 实现 布尔 运算 时 ,会 用 到 FPGA 的 哪些 模块 ? 
FPGA 是 如 何 进行 配置 的 ? 它 是 一 种 高 能 效 的 器 件 吗 ?FPCGA 适合 哪些 应 用 场景 ? 

11. 在 关于 内 存 的 讲述 中 ， 有 时 说 “小 即 优秀 ”， 这 样 说 的 理由 是 什么 ? 

12. 开发 这 样 的 一 个 FlexRay™ 簇 : “MRA TAL B,C, DALES 个 节点 ， 
所 有 节点 通过 两 个 通道 互 连 。 簇 使 用 总 线 拓扑 ， 由 于 节点 4、B、C 执行 着 安全 关 
键 的 任务 ， 因 此 它们 在 总 线 上 的 请 求 必须 在 20 FA (macroticks) 内 得 到 回应 。 下 
面 是 希望 读者 去 完成 的 部 分 : 

1) FÆ levi FlexRay 模拟 器 [ Sirocic and Marwedel, 2007a], ff FE. zip 文件 并 
安装 它 。 

2) 执行 leviFRP. jar 从 而 进行 训练 模式 。 

3) 在 训练 模式 下 设计 上 面 描述 的 FlexRay $E, 

4) 配置 通信 周期， 保证 节点 4、B、C 在 总 线 上 的 最 大 访问 延迟 在 20 宏 拍 以 
内 ,节点 D、E 仪 使 用 通信 周期 中 的 动态 段 。 
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5) 配置 节点 的 总 线 请 求 。 节 点 A 在 每 个 周期 都 发 送 一 条 消息 ,节点 了 与 C 每 
两 个 周期 发 送 一 条 消息 ， 节 点 D 在 每 个 周期 发 送 一 条 长 度 为 两 个 微 时 隙 (minis- 
lots) 的 消息 ， 节 点 每 两 个 周期 发 送 一 条 长 度 为 两 个 微 时 隙 的 消息 。 

6) 在 可 视 化 视图 中 检查 节点 4、B、C 的 总 线 请 求 能 否 被 保证 得 到 响应 。 

7) 在 动态 段 中 交换 节点 D 与 节点 五 的 位 置 ， 会 导致 什么 结果 ? 

13. 设计 一 个 3bit D-A 转换 器 的 电路 图 ， 转 换 器 需要 对 一 个 3bit 的 向 量 x 完成 
编码 。 证 明 输出 电压 与 输入 向 量 x 之 间 是 成 比例 关系 的 。 如 果 x 表示 的 是 两 个 互补 
的 数 ， 电 路 应 当 如 何 修 改 ? 

14. 附录 B 中 的 图 B. 4 是 一 个 放大 器 ， 如 果 在 输入 端 加 上 电压 V, WA 

Vow =Betosea * Vi 

计算 以 R 和 Ri 表达 的 图 B. 4 中 的 增益 gaosi o 
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并 不 是 所 有 的 符 入 式 系统 的 设计 都 要 从 头 做 起 ， 有 一 些 符合 标准 的 模块 可 以 实 
现 复 用 ， 这 些 模块 由 一 些 之 前 设计 的 成 果 以 及 某 些 含有 知识 产权 的 模块 构成 。 在 日 
渐 复 杂 的 系统 中 ， 对 含有 知识 产权 的 模块 进行 复 用 ， 是 加 快 系统 设计 速度 的 一 种 积 
极 应 对 的 方式 。 术 语 “知识 产权 模块 复 用 ”更 多 的 是 指 对 于 硬件 模块 的 重用 ， 但 
是 仅仅 对 硬件 进行 重用 还 远 远 不 够 。Sangiovanni-Vincentelli 指出 ， 软 件 也 应 该 像 硬 
件 一 样 进行 复 用 。 因 此 ，Sangiovanni-Vincentelli [ Sangiovanni-Vincentelli, 2002] 18 

导 在 设计 阶段 就 应 该 同时 考虑 到 软 、 硬 件 的 复 用 性 。 

系统 软件 模块 作为 标准 软件 模块 的 一 部 分 是 可 以 进行 复 用 的 ， 这 其 中 包括 媒人 
式 操 作 系 统 以 及 中 间 件 。 中 间 件 是 指 软 件 在 操作 系统 以 及 应 用 软件 之 间 提 供 了 一 个 
中 间 层 。 将 库 文件 看 作 一 种 特殊 的 ， 用 于 通信 的 中 间 件 ， 操 作 系 统 提供 这 些 库 文件 
作为 基本 的 通信 工具 。 并 且 ， 认 为 实时 的 数据 库 是 第 二 层次 的 中 间 件 (参见 4.5 
TD) 。 调 用 标准 的 软件 模块 可 能 已 经 包含 在 了 规格 说 明 书 中 。 有 关 这 些 标准 模块 的 
API (Application Programming Interface， 应 用 程序 接口 ) 信息 可 能 需要 完全 执行 
SUD 的 规范 。 

参照 设计 流程 ， 将 会 在 本 章 进 行 嵌 入 式 操作 系统 以 及 中 间 件 的 描述 ( 见 图 
4.1). 



















































ia 
了 规格 说 明 书 设计 仓库 (十 ) 
应 oa >. 
用 应 用 筹划 测试 
程 
序 设计 优化 
ae 评估 与 批准 


图 4.1 简化 的 设计 流程 图 


4.1 瞬 入 式 操作 系统 


4.1.1 总 体 需 求 
除了 极其 简易 的 系统 外 ， 调 度 系统 、 进 程 切换 以 及 IO 管理 都 需要 一 个 适合 的 
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嵌入 式 操 作 系统 作为 支撑 。 进 程 调度 (或 者 叫做 进程 分 配 ) 可 以 使 每 一 个 任务 都 
像 自己 有 一 个 独占 的 处 理 器 一 样 运行 。 

通过 虚拟 内 存 系统 ， 可 以 使 不 同 的 进程 以 及 线程 运行 在 不 同 的 地 址 空间 上 。 每 
个 进程 都 拥有 自己 的 地 址 空间 ， 反 之 若干 线程 有 可 能 共享 同一 段 地 址 空间 。 相 对 于 
不 使 用 虚拟 内 存 系统 的 系统 ， 使 用 虚拟 内 存 的 系统 在 进行 进程 的 上 下 文 切换 时 ， 需 
要 花费 更 多 的 时 间 。 线 程 的 特点 就 是 可 以 共享 同一 段 地 址 空间 ， 并 可 以 使 用 共享 内 
存 进 行 线程 间 通 信 。 操 作 系 统 也 必须 向 进程 和 线程 提供 同步 及 通信 的 方法 。 更 多 的 
有 关系 统 软 件 的 知识 可 以 在 操作 系统 类 的 相关 教科 书 上 获得 ， 例 如 Tanenbaum 
[Tanenbaum，2001]2 所 著 书 籍 。 

下 面 是 庶 和 人 式 操作 系统 一 些 必 不 可 少 的 功能 : 

1) 鉴于 诅 人 式 系统 需求 的 多 样 性 ， 伐 人 式 操作 系统 所 能 提供 的 功能 也 是 多 种 
多 样 的 。 由 于 对 系统 性 能 要 求 比较 高 ， 运 行 操作 系统 所 能 提供 的 所 有 功能 几乎 是 不 
可 能 的 。 对 于 绝 大 多 数 应 用 程序 来 说 ， 操 作 系 统 必 须 尽 可 能 短小 精 悍 ， 因 此 需要 针 
对 所 要 运行 的 程序 对 操作 系统 进行 灵活 定制 。 可 配置 性 也 是 圣人 式 操作 系统 非常 重 
要 的 特性 之 一 。 在 实现 操作 系统 的 可 配置 性 上 ， 也 有 着 丰富 的 手段 ， 这 包括 人 

© 面向 对 象 ， 可 以 用 来 衍生 出 适合 的 子 类 : 例如 ， 可 以 通过 一 个 通用 的 调度 器 
的 类 ， 从 这 个 类 中 ， 可 以 衍生 出 适当 的 、 具 有 自己 特点 的 子 类 。 然 而 ， 面 向 对 象 的 方 
法 通常 会 产生 一 些 额 外 的 系统 开销 ， 例 如 面向 对 象 特 征 中 的 多 态 性 ， 就 会 产生 额外 的 
运行 时 开销 。 这 些 开销 对 于 对 性 能 要 求 较 高 的 系统 来 说 ， 有 时 显得 难以 接受 。 

© 面向 方面 的 编程 [Lohmann et al. ，2009] : 随 着 这 个 概念 的 不 断 研究 和 发 
展 ， 正 交 软 件 架 构 可 以 描述 为 一 种 ， 子 模块 具有 较 强 独立 性 以 及 相关 模块 可 以 无 需 
考虑 其 他 模块 的 相关 性 即 可 添加 的 编码 过 程 。 例 如 ， 对 某 些 代码 的 分 析 可 以 被 描述 
为 一 个 单独 的 模型 。 这 些 代 码 可 以 不 经 思索 从 相关 的 源码 中 进行 添加 和 删除 。 
CIAO 系列 的 操作 系统 即 采用 了 这 种 方法 进行 设计 [Lohmann et al. , 2006] 。 

@ 条 件 编译 : 通过 使 用 #if 以 及 #fdef 预 处 理 命令 可 以 使 用 宏 进行 预 处 理 以 实 
现 条 件 编译 。 

O 高 级 编译 时 评估 ， 在 编译 操作 系统 之 前 ， 可 以 将 一 些 变量 预先 赋予 一 些 常 
量 的 值 ， 编 译 器 尽 可 能 将 这 些 值 向 下 进行 传递 ， 这 将 会 对 编译 器 的 性 能 产生 一 定 的 
优化 。 假 如 某 个 特定 的 函数 参数 一 直 是 常量 ， 那 么 这 个 参数 就 可 以 从 该 函数 的 参数 
列表 中 移 除 。 局 部 评估 [ Jones, 1996] 为 上 述 的 编译 器 优化 提供 了 一 个 框架 。 在 
茶 些 情况 下 ,动态 的 数据 有 可 能 被 静态 数据 替换 掉 [Atienza et al. ，2007] 。 一 项 
有 关 操 作 系统 定制 的 报告 已 由 McNamee [ McNamee et al. , 2001] SARK. 














”如果 本 书 读者 没有 学 习 过 有 关 操 作 系 统 的 相关 课程 ， 那 么 在 进行 后 续 部 分 知识 的 学 习 前 ， 有 必要 进 
行 一 下 操作 系统 相关 知识 的 学 习 。 
O ”此 列表 由 开发 过 程 中 的 开发 顺序 或 者 工具 链 作为 排序 标准 。 
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© 无 用 函数 链接 时 移 除 ， 在 目标 链接 时 的 早期 ,会 有 很 多 使 用 或 未 使 用 的 函 
数 的 信息 。 例 如 ， 链 接 器 会 指出 究竟 使 用 了 库 里 的 哪些 函数 ， 至 于 没有 使 用 到 的 也 
数 则 可 以 被 丢弃 掉 [ Chanet et al. , 2007], 

这 些 技术 往往 被 包含 于 操作 系统 的 某 些 可 选择 的 规则 文件 中 。 裁 前 操作 系统 
时 ， 可 以 通过 图 形 用 户 界 面 进 行 功能 配置 ， 从 而 使 得 裁剪 变 得 更 加 容易 。 例 如 ， 
Wind River 公司 的 VxWorks [ Wind River, 2010a] 就 可 以 通过 图 形 界面 进行 配置 。 

对 于 裁剪 出 来 的 操作 系统 而 言 ， 功 能 验证 也 是 一 个 潜在 的 问题 。 每 一 个 经 裁 前 
得 出 的 操作 系统 都 必须 经 过 充分 的 验证 。Takada 提 到 ， 对 于 eCos 来 说 ， 如 何 验证 
大 约 200 个 配置 选项 是 一 个 潜在 的 问题 (eCos 是 一 个 由 Red Hat 推出 的 开源 的 实时 
操作 系统 [Massa，2002 ] ) 。 产 品 线 软件 工程 【Pohl et al. , 2005 ] 针对 上 述 问题 
提出 了 若干 解决 方案 。 

2) 藤 入 式 系统 中 有 大 量 的 、 多 种 多 样 的 外 围 设备 。 许 多 租 入 式 系统 并 没有 硬 
盘 、 键 盘 、 屏 幕 或 者 鼠标 。 也 许 对 于 操作 系统 来 说 ， 除 了 系统 时 钟 外 ， 没 有 什么 设 
备 是 必要 的 。 应 用 程序 经 常 被 设计 用 来 处 理 各 种 各 样 特殊 的 设备 。 在 这 种 情况 下 ， 
设备 不 会 被 应 用 程序 共享 ， 并 且 操 作 系 统 也 没有 管理 设备 的 必要 。 由 于 设备 的 数量 
确实 庞大 ， 操 作 系统 也 难以 将 所 有 能 支持 的 设备 驱动 都 放 和 人 操作 系统 中 。 因 此 ， 将 
操作 系统 和 驱动 进行 分 离 ， 仅 通过 一 个 特殊 的 任务 进行 设备 管理 就 比 将 驱动 集成 进 
操作 系统 有 必要 得 多 。 并 且 由 于 大 量 的 嵌入 式 设备 的 速度 较 低 ， 从 性 能 角度 出 发 考 
虑 ， 也 没有 必要 将 其 集成 进 操作 系统 中 。 由 此 则 会 产生 不 同 的 软件 层 。 就 PC 来 
说 ， 像 硬盘 驱动 、 网 络 驱动 以 及 音频 驱动 都 被 假定 为 是 存在 的 。 这 些 驱动 都 在 较 低 
的 软件 层 中 实现 。 作 为 所 有 应 用 程序 的 标准 ，API 和 中 间 件 在 顶端 实现 ， 对 于 嵌入 
式 操 作 系 统 来 说 ， 设 备 驱动 的 实现 是 在 内 核 之 上 的 。 应 用 程序 和 中 间 件 有 可 能 是 在 
驱动 之 上 实现 ， 而 不 是 在 操作 系统 的 API 上 实现 ( 见 图 4.2)。 
























































应 用 软件 应 用 软件 
中 间 层 中 间 层 | 
设备 驱动 | ”设备 驱动 | 操作 系统 内 核 
操作 系统 内 核 设备 驱动 设备 驱动 | 
a) b) 


图 4.2 在 操作 系统 内 核 之 上 (图 4.2a) 和 之 下 (图 4.2b) 实现 的 设备 驱动 


此 处 再 次 使 用 VxWorks 为 例 。 图 4. 3 显示 了 一 部 分 Wind River ® 公司 的 平台 架 
构 [Wind River, 2010a] 。 

3) 保护 机 制 并 不 总 是 必要 的 ， 由 于 散人 式 系统 经 常 被 设计 用 于 某 种 单一 的 目 
的 (他 们 并 不 被 认为 用 于 支持 所 谓 的 多 道 程序 ) ， 因 此 未 经 验证 的 程序 几乎 不 可 能 
被 载 人 运行 。 当 软件 经 过 测试 后 ， 该 软件 就 被 认定 为 是 可 靠 的 ， 这 也 适用 于 IO 
中 。 与 桌面 程序 形成 鲜明 对 照 的 是 ， 它 们 没有 实现 O 指令 作为 特权 指令 的 需要 ， 





132 BAK AAH 嵌入 式 信息 物理 系统 基础 ( 原 书 第 2 版 ) 





任务 允许 去 做 它们 自己 的 0 操作。 与 之 前 相 比 ， 这 样 可 以 很 好 地 减少 1/0 操作 的 
系统 开销 。 


























CAN | TCP/IP | 闪存 文件 系统 
串口 | || 以 太 网 USB DOS 文 件 系统 
VxWorks 实时 操作 系统 
BSP 开发 工具 
ies 硬件 文档 以 及 相关 工具 | 











图 4.3 Wind River® 公司 开发 平台 软件 层次 


示例 : switch 对 应 需要 进行 O 地 址 映射 的 开关 ， 这 些 开关 需要 某 些 程序 来 进行 检 
测 。 可 以 使 用 指令 
load register,switch 

去 检查 这 些 开关 。 这 种 操作 没有 通过 使 用 操作 系统 调用 的 必要 ， 因 为 系统 调用 
会 造成 频繁 的 系统 上 下 文 切 换 (寄存 器 组 等 ) ， 导 致 不 必要 的 系统 开销 。 

在 对 灵活 性 要 求 较 高 的 伐 入 式 系统 中 ， 不 使 用 保护 机 制 是 一 种 趋势 ， 但 是 基于 
安全 性 的 需求 也 使 得 保护 机 制 变 得 非常 必要 。 特 殊 存 储 器 管理 单元 就 是 在 这 种 情况 
下 被 提出 的 (参见 Fiorin [Fiorin et al. , 2007] 相关 著作 ) 。 

4) 中 断 可 以 与 任何 进程 相关 联 。 通 过 操作 系统 的 系统 调用 ， 当 中 断 发 生 时 ， 
可 以 要 求 操作 系统 开始 运行 或 者 停止 运行 任务 。 甚 至 可 以 把 任务 的 起 始 地 址 保存 在 
中 断 向 量 表 中 ， 但 这 样 做 非常 危险 ， 因 为 操作 系统 有 可 能 忽视 实际 运行 的 任务 。 并 
且 ， 可 组 合 性 可 能 也 要 受到 这 些 影响 ,假如 一 个 特殊 的 任务 直接 关联 到 了 某 些 中 断 
上 ， 那 么 这 个 任务 可 能 很 难 添加 到 其 他 任务 中 ， 因 为 其 他 任务 也 需要 一 些 事件 才能 
够 触发 并 启动 。 特 殊 应 用 的 设备 驱动 (假如 被 用 到 ) 也 许 会 在 中 断 和 任务 之 间 建 
立 链接 。 l 
5) WARARARALN AR, Ak, RRSP MEAS SE 
作 系 统 。 

AKADEMA BZ AAA LZ Bertolotti [ Bertolotti, 2006] 所 著 书 中 
的 有 关 章 节 获 得 。 该 书 中 包含 了 艇 人 系统 的 架构 、POSIX 标准 、 开 源 实时 操作 系统 
以 及 一 些 虚 拟 化 方面 的 内 容 。 


4.1.2 实时 操作 系统 


定义 : 实时 操作 系统 是 用 来 支持 实时 系统 的 操作 系统 [Takada，2001 ] 。 
那么 如 何 认为 一 个 操作 系统 是 否 为 实时 操作 系统 呢 ? 有 如 下 4 个 关键 点 用 于 
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判断 : 

1) 操作 系统 的 时 间 行 为 必须 可 预测 。 对 操作 系统 的 任何 服务 来 说 ， 都 必须 有 
一 个 明确 的 执行 时 间 的 上 界 作为 保证 。 实 际 上 ， 这 里 也 有 不 同 的 针对 时 间 的 预测 等 
级 。 比 方 说 ， 对 于 某 组 系统 调用 来 说 ， 明 确 地 知道 这 组 系统 调用 的 运行 时 间 的 上 
界 ， 而 男 一 种 系统 调用 的 运行 时 间 则 较 不 确定 。 类 似 于 “获得 当前 时 间 ” 的 系统 
调用 就 属于 此 类 。 而 另 一 种 调用 ， 则 可 能 有 较 大 的 变化 。 例 如 分 配 4MB 空闲 内 存 
的 调用 ， 则 可 能 属于 第 二 类 。 特 别 要 提 及 的 ， 实 时 操作 系统 的 调度 策略 必须 具有 确 
定性 。 

中 断 在 某 些 时 刻 需要 被 禁止 ， 以 避免 系统 之 间 各 个 模块 互相 干扰 。 更 有 其 时 ， 
为 了 避免 任务 之 间 的 互相 影响 ， 中 断 也 应 该 被 禁止 。 关 闭 中 断 的 时 间 必 须 尽 可 能 
短 ， 以 避免 一 些 不 可 预测 的 系统 延迟 以 及 某 些 关键 时 间 的 处 理 。 

由 于 实时 操作 系统 的 文件 系统 有 时 需要 在 硬盘 上 部 署 ， 所 以 应 该 尽 可 能 将 连续 
的 文件 (文件 应 存储 于 连续 的 磁盘 空间 上 ) 放置 在 连续 的 柱 面 ， 以 避免 磁头 进行 
无 法 预测 以 及 没有 必要 的 移动 。 

2) 操作 系统 必须 进行 任务 调度 管理 。 多 个 任务 的 执行 时 间 间 隔 ， 以 及 特定 场 
景 下 的 初始 执行 时 间 ， 即 调度 。 而 且 ， 操 作 系 统 应 该 知道 每 一 个 任务 的 死 线 ， 以 便 
于 操作 系统 应 该 申请 恰当 的 调度 策略 (操作 系统 只 需要 提供 在 指定 时 间或 者 指定 
优先 级 启动 任务 的 服务 ) 。 有 关 调 度 算法 的 细节 会 在 第 6 章 进行 讨论 。 

3) 有 些 系统 也 需要 操作 系统 进行 时 间 管 理 。 如 果 进 程 与 物理 环境 相关 联 ， 那 
么 操作 系统 就 必须 要 进行 时 间 管 理 。 物 理 时 间 由 实数 来 描述 ， 在 计算 机 中 常 被 离散 
时 间 代 替 。 根 据 具 体 的 需求 有 可 能 不 同 : 

D 在 有 些 系 统 中 ， 与 全 球 标准 时 间 进 行 同步 是 必需 的 。 在 这 种 情况 下 ， 全 球 
时 钟 同步 概念 被 提出 。 有 两 个 标准 可 以 用 来 进行 时 间 同 步 : 

a. 协调 世界 时 (Universal Time Coordinated, UTC): UTC 由 天 文学 上 的 标准 来 
进行 定义 。 由 于 地 球 运 动 的 变化 ， 这 个 时 间 标 准 必须 要 随时 进行 调整 。 在 每 一 年 的 
年 终 交 蔡 时 ， 有 可 能 需要 添加 若干 秒 的 时 间 。 这 个 调整 有 可 能 会 造成 一 些 问题 ， 由 
于 有 些 软件 设计 的 缺陷 ， 在 跨 年 时 有 可 能 会 两 次 进入 到 下 一 年 。 

b. 国际 原子 时 间 [通过 原子 钟 进行 定时 ， 法 语 为 Temps Atomic Internationale. 
(TAI) ] ， 这 个 标准 不 受 任何 人 为 影响 。 

有 时 与 外 部 环境 关联 的 目的 就 是 为 了 获取 准确 的 时 间 。 外 部 的 同步 通常 基于 无 
线 通 信 协 议 ， 例 如 全 球 定 位 系统 (GPS) [National Space-Based Positioning, Naviga- 
tion, and Timing Coordination Office, 2010] 或 移动 电话 网 络 。 

D WRRARASIAF A , IA C OT LM Ue Be SRB PS A AY I 
时 间 信息 与 本 地 时 间 进 行 同步 。 假 若 这样 ， 互 连 的 伐 入 式 系统 就 可 以 尝试 取得 当前 
时 间 的 一 致 视图 。 

(3 在 有 需要 的 前 提 下 ， 提 供 尽 可 能 精准 的 本 地 时 延 。 
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对 有 些 应 用 来 说 ， 提 供 高 精度 的 时 间 服 务 是 充分 条 件 。 举 例 来 说 ， 有 时 这 些 应 
用 需要 分 辨 错误 发 生 的 先后 顺序 。 例 如 ， 它 们 可 以 帮助 鉴别 导致 停电 的 原因 是 否 是 
由 发 电 装置 引起 的 (参见 [Novosel，2009 ] ) 。 时 间 服 务 的 准确 度 取决 于 特定 的 执 
行 平台 的 支持 。 如 果 时 间 服 务 程序 在 进程 级 别 中 实现 ， 那 么 时 间 精 度 ( 微 秒 级 别 ) 
将 变 得 极 不 准确 ; 如 果 时 间 服 务 程序 在 硬件 级 别提 供 ， 那 么 时 间 精 度 ( 微 秒 级 别 ) 
将 变 得 非常 准确 。 更 多 有 关 时 间 服 务 以 及 时 钟 同步 的 信息 ， 请 参考 Kopetz [ Kope- 
tz, 1997] 的 相关 书籍 。 

4) 操作 系统 必须 极 有 效率 。 如 果 操 作 系 统 的 效率 不 够 ， 那 么 上面 所 有 提 到 的 
内 容 都 是 无 用 的 。 因 此 ， 操 作 系 统 必须 足够 快 。 

每 个 实时 操作 系统 都 包括 一 个 所 谓 的 实时 操作 系统 内 核 。 这 些 内 核 所 管理 的 资 
源 可 以 在 任何 一 个 实时 操作 系统 中 找到 ， 包 括 处 理 器 、 内 存 以 及 系统 时 钟 。 内 核 的 
主要 工作 包括 任务 管理 、 作 业 间 同步 以 及 通信 、 时 钟 管理 和 存储 器 管理 。 

有 些 实时 操作 系统 被 设计 用 来 做 通用 的 诗人 式 应 用 ， 有 一 些 则 专注 于 某 些 特殊 
领域 。 例 如 ，O0SEKAVDX 操作 系统 主要 用 于 汽车 控制 领域 。 操 作 系 统 对 于 指定 的 
某 些 领域 可 以 提供 一 些 专属 的 服务 ， 这 样 的 操作 系统 对 于 这 样 的 领域 结合 更 加 紧 
密 ， 在 这 个 领域 上 也 往往 优 于 能 够 提供 多 种 服务 领域 的 操作 系统 。 

同样 地 ， 一 些 RTOS 提供 标准 的 API， 而 另 一 些 RTOS 会 提供 它们 自己 专属 的 
API。 例 如， 有 些 RTOS 遵从 了 UNIX POSIX RT-extension 的 接口 标准 [ Harbour, 
1993 ] ， 有 些 则 使 用 的 是 OSEKAVDX 标准 ， 有 些 则 使 用 了 日 本 的 开发 标准 ITRON, 
许多 实时 内 核 都 有 自己 的 API， 上 文 提 到 过 的 ITRON ， 是 一 个 使 用 链接 时 配置 的 成 
熟 的 RTOS, 

可 用 的 RTOS 可 以 被 进一步 分 为 如 下 三 类 [Gupta，2002 ] : 





O 快速 专用 内 核 。Gupta 说 :“ 对 于 复杂 系统 来 说 ， 系 统 运行 的 速度 是 重 中 之 
重 。 这 些 内 核 的 设计 基点 就 是 尽 可 能 快 的 运行 ， 而 不 是 进行 所 有 事情 的 预测 。” 这 


种 系统 包括 QNX、PDOS、VCOS、VTRX32、VxWorks。 

D 对 标准 操作 系统 的 实时 性 扩展 。 为 了 尽 可 能 利用 和 适 配 主流 的 操作 系统 而 
又 同时 支持 实时 性 ， 一 种 既 支 持 实 时 任务 也 支持 普通 任务 的 混合 系统 得 到 了 充分 的 
发 展 。 在 这 类 系统 中 ， 有 一 个 实时 的 内 核 执行 所 有 实时 的 任务 。 另 外 有 一 个 标准 的 
操作 系统 去 执行 所 有 非 实时 的 任务 ( 见 图 4.4) 。 


实时 任务 1 实时 任务 2 
设备 驱动 设备 驱动 


| 实时 内 核 





非 实时 任务 ! | 非 实时 任务 2 








标准 内 核 








图 4.4 混合 操作 系统 


这 种 混合 式 操作 系统 有 一 些 优点 : 系统 可 以 使 用 标准 的 操作 系统 的 API， 可 以 
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拥有 GUI (Graphical User Iterfaces ， 图 形 用 户 接口 ) 、 文 件 系统 等 。 而 且 可 以 使 得 
标准 的 操作 系统 更 快 地 适应 嵌入 式 引 用 。 另 外 ， 这 些 标准 操作 系统 的 非 实 时 任务 也 
不 会 对 实时 任务 产生 任何 消极 的 影响 ， 甚 至 标准 操作 系统 的 崩 演 也 不 会 影响 到 这 些 
实时 任务 。 不 利 的 一 面 是 (这 些 也 可 以 从 图 4.4 中 见 到 ) ， 在 设备 驱动 方面 可 能 会 
过 到 一 些 问题 ， 因 为 标准 操作 系统 也 会 拥有 自己 的 设备 驱动 。 为 了 避免 实时 任务 驱 
动 以 及 其 他 任务 驱动 之 间 的 影响 ， 实 时 任务 和 非 实 时 任务 有 可 能 需要 对 设备 分 开 进 
行 操作 。 虽 然 也 有 很 多 的 尝试 在 尽 可 能 不 影响 实时 性 能 的 前 途 下 去 试图 弥补 这 两 者 
之 间 的 鸿沟 ， 但 是 对 于 实时 任务 来 说 ， 很 多 标准 操作 系统 能 提供 的 服务 ， 例 如 文件 
系统 访问 以 及 GUI 还 是 不 能 被 实时 任务 所 使 用 。RT-Linux 是 这 种 混合 类 操作 系统 
的 一 个 示例 。 

Gupta [Gupta, 2002] 说 到 ， 尝 试 使 用 某 个 版 本 的 标准 操作 系统 “是 一 种 不 正 
确 的 方法 ， 因 为 有 太 多 的 基本 的 和 不 恰当 的 潜在 假设 仍然 存在 ， 例 如 对 普通 用 例 的 
优化 不 是 对 最 坏 的 用 例 ) ， 忽 略 大 多 数 的 语义 信息 (如 果 不 是 全 部 的 语义 信息 ) 
以 及 独立 的 CPU 调度 和 资源 分 配 ”。 的 确 ， 大 多 数 标准 操作 系统 的 应 用 之 间 的 任务 
依赖 并 不 是 非常 频繁 ， 因 此 经 常会 被 这 样 的 系统 忽略 。 这 种 情况 不 同 于 媒人 入 式 系 
统 ， 由 于 任务 间 的 依赖 相当 普遍 ， 这 些 情况 也 应 当 被 考虑 进去 。 不 幸 的 是 ， 基 于 标 
准 操 作 系 统 扩展 的 实时 系统 很 难 对 这 些 情况 进行 处 理 ， 此 外 资源 的 分 配 以 及 调度 也 
很 少 与 标准 的 操作 系统 相 结合 。 然 而 ， 为 了 确保 对 时 间 的 限制 要 求 ， 资 源 的 分 配 以 
及 调度 算法 集成 还 是 必 不 可 少 的 。 

© 有 很 多 的 研究 体系 把 目光 瞄 向 了 上 面 的 那些 限制 ， 这 其 中 包括 Melody 
[ Wedde and Lind, 1998] 以 及 MARS (基于 Gupta 的 研究 [ Gupta，2002 ] )、 
Spring, MARUTI, Arts, Hartos 和 DARK。 

Takada [ Takada, 2001] 提出 了 一 种 低 开 销 的 内 存 保 护 机 制 ， 暂 时 地 保护 计算 
所 用 到 的 资源 〈 针 对 预防 任务 使 用 比 一 开始 分 配 的 时 间 更 多 的 时 间 ) ， 用 于 片上 多 
核 系统 〈 特 别 是 异 构 多 处 理 器 以 及 多 核 处 理 器 ) 的 RTOS 以 及 用 于 连续 的 媒体 流 数 
据 处 理 以 及 服务 控制 的 保证 。 

基于 欣 入 式 系统 市 场 增长 的 潜力 ， 标 准 操作 系统 的 开发 商 开始 积极 地 尝试 去 销 
售 他 们 产品 的 一 些 变 化 版 本 (例如 柑 入 式 Windows [Microsoft Inc. ，2003]) ， 并 且 
开始 尝试 从 一 些 传统 的 嵌入 式 厂商 (例如 Wind River) 手中 获取 市 场 份额 。 


4.1.3 虚拟 机 


在 有 些 环境 中 ， 使 用 一 个 真实 的 处 理 器 去 模拟 许多 处 理 器 是 非常 有 用 的 。 通 过 
虚拟 机 在 硬件 上 的 执行 ， 使 得 这 一 想法 成 真 。 在 虚拟 机 上 ， 可 以 运行 多 种 不 同 的 操 
作 系统 。 很 明显 ， 这 允许 多 个 操作 系统 同时 运行 在 一 个 处 理 器 上 。 在 嵌入 式 系统 
上 ， 虚 拟 机 务必 要 小 心地 使 用 ， 因 为 系统 的 暂 态 行为 也 有 可 能 导致 产生 很 多 的 问 
题 ， 而 且 时 间 的 可 预测 性 也 有 可 能 会 丢失 。 但 是 虚拟 机 在 某 些 情况 下 也 有 其 独到 的 





136 嵌入 式 系 统 设计 嵌入 式 信 息 物理 系统 基础 ( 原 书 第 2 版 ) 





用 处 。 例 如 ， 有 可 能 需要 在 一 个 处 理 器 上 运行 多 个 操作 系统 遗留 的 应 用 。 虚 拟 机 的 
所 有 功能 已 经 超出 了 本 书 所 能 描述 






































的 范围 。 感 兴趣 的 读者 可 以 去 参考 应 用 1 应 用 2 应 用 3 
Smith $A [Smith and Nair, 2005 ] OS 1 API 1 RTE | 
所 著 的 相关 书籍 以 及 Craig [ Craig, pikeOS 

2006] 所 著 的 相关 书籍 。PikeOS 是 

一 个 致力 于 虚拟 化 方面 的 嵌入 式 操 

作 系 统 的 范例 [SYSGO AG, 图 4.5 PikeOS 虚拟 化 (© SYSGO) 


2010], PikeOS 允许 系统 资源 ( 例 

如 存储 器 、LO 设备 、CPU 时 间 片 ) 划分 为 各 个 独立 的 子 集 。Pike0S 使 用 的 是 微 
内 核 ， 许 多 操作 系统 的 API 以 及 实时 运行 环境 (RTE) 都 可 以 在 这 个 内 核 的 基础 上 
运行 ( 见 图 4.5)。 


4.1.4 资源 访问 协议 


4.1.4.1 优先 级 反 转 

在 某 些 情况 下 ， 任 务必 须 互 斥 地 进行 资源 访问 。 例 如 全 局 共享 变量 或 者 是 某 些 
设备 ， 以 避免 不 确定 或 者 不 期 望 的 进程 的 行为 。 对 舱 人 式 系统 来 说 ， 这 种 互 斥 操作 
非常 重要 ， 例 如 基于 共享 内 存 的 进程 间 通 信 或 者 互 斥 地 去 访问 某 些 特定 的 硬件 设 
备 。 需 要 互 斥 访问 这 些 共 享 资源 的 代码 段 称 之 为 临界 区 ， 被 临界 区 访问 的 资源 称 之 
为 临界 资源 。 临 界 区 应 尽 可 能 短 ， 操 作 系 统 特别 提供 了 一 系列 的 原 语 用 来 申请 以 及 
释放 访问 这 些 临 界 资源 ， 这 种 原 语 称 作 互 斥 锁 。 直 到 被 持 有 的 锁 被 释放 ， 临 界 区 才 
被 允许 去 访问 临界 资源 。 因 此 ， 没 有 获得 锁 的 临界 区 必须 去 等 待 锁 被 释放 ， 并 且 恢 
复 优 先 级 最 高 的 进程 得 到 执行 。 

本 书 中 ， 将 请 求 锁 得 操作 命名 为 P (S) 操作 ， 并 且 将 释放 锁 的 操作 命名 为 V 
(S) 操作 ，S 表示 所 要 请 求 和 释放 的 锁 。P (S) 操作 以 及 V (S) 操作 又 被 统称 为 
信号 量 操 作 。 信 号 量 允 许 最 多 n 个 (n 表示 一 个 变量 ) 线程 或 者 进程 同时 访问 某 段 
临界 资源 。S 是 一 个 可 维护 的 数据 结构 已 表示 还 有 多 少 临界 资源 可 用 。P (S) 操 
作 检 查 计数 ， 当 没有 可 以 使 用 的 临界 资源 时 ， 阻 塞 调用 者 。 如 果 有 可 用 临界 资源 ， 
则 修改 计数 ， 并 且 调 用 者 也 可 继续 执行 。V (S) 增加 可 用 资源 的 数量 ， 并 确保 假 
如 有 被 阻塞 的 临界 区 时 ， 解 除 对 临界 区 的 阻塞 。P (S) 操作 以 及 V (S) 操作 源 自 
于 荷兰 语 ， 将 使 用 这 些 操作 当 互 斥 的 信号 量 ， 也 就 是 ”= 1 时 的 信号 量 。 当 信和 号 量 
作为 互 斥 量 时 ， 同 一 时 刻 只 允许 一 个 临界 区 去 访问 临界 资源 。 

对 嵌入 式 系统 来 说 ， 任 务 之 间 经 常 是 有 依赖 关系 的 ， 而 非 相互 独立 。 另 外 ， 实 
时 应 用 的 优先 级 也 比 非 实 时 任务 的 优先 级 更 加 重要 。 在 这 种 情况 下 ， 对 临界 资源 的 
访问 有 可 能 导致 优先 级 反 转 ， 优 先 级 反 转 即 低 优先 级 的 任务 有 可 能 在 高 优先 级 的 任 
务 执行 之 前 先 被 执行 。 优 先 级 反 转 在 非 由 和 人 式 系统 中 也 存在 。 然 而 ， 由 于 之 前 列 出 
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的 原因 ， 可 以 认为 在 嵌入 式 系统 中 发 生 优 先 级 反 转 的 情况 更 加 让 人 无 法 接受 。 
第 一 个 例子 是 由 “临界 资源 ”以 及 “不 支持 抢占 ”导致 的 优先 级 反 转 ， 如 图 
4.6 所 示 。 























P(S) V(S) 
T Ti 被 阻塞 
全 天 
T> P(S) V(S) 
je 一 EE ee | 
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图 4.6 被 低 优先 级 的 任务 阻塞 


黑色 的 向 上 指向 的 箭头 表示 在 这 一 时 刻 哪 个 任务 开始 执行 ， 或 者 是 进入 “就 绪 
态 ”。 FE ty A, FEST, 进入 临界 区 后 ， 要 求 独占 地 访问 临界 资源 ， 并 使 用 了 P 操 
作 。 在 t 时 刻 , 任务 T, 进入 就 绪 态 ， 并 抢占 了 任务 T, WBA. TE 时 刻 ， 由 于 T, 
持 有 临界 资源 的 互 斥 锁 ， 的 临界 区 试图 获取 临界 资源 时 ， 被 阻塞 掉 。 任 务 7 恢复 
执行 并 在 某 一 时 刻 释 放 掉 了 临界 资源 。 释 放 的 操作 会 去 检查 被 挂 起 的 任务 是 否 有 优先 
级 高 于 了 W, WRA, AE T, 的 处 理 器 资源 。 此 时 从 T, 的 阻塞 可 以 看 到 ，- 一 
个 低 优先 级 的 任务 阻塞 掉 了 一 个 高 优先 级 的 任务 。 需 要 互 斥 的 访问 某 些 临界 资源 是 导 
致 这 种 结果 的 主要 原因 。 幸 运 的 是 ， 图 4. 6 只 是 某 些 特殊 情况 ， 阻 塞 的 持续 时 间 不 会 
超过 7 的 临界 区 长 度 。 这 种 情况 会 导致 系统 发 生 异 常 ， 并 很 难 避免 。 

在 有 些 情 况 下 ， 事 情 还 会 变 得 更 糟 。 可 以 在 图 4.7 中 看 到 相关 的 例子 。 
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图 4.7 潜在 的 长 时 间 优 先 级 反 转 


假定 有 T. T, 以 及 7,3 个 进程 。7 的 优先 级 最 高 ，7, 的 优先 级 居中 ，7, 的 优 
先 级 最 低 。 另 外 ， 假 定 7, AT, 需要 通过 P 操作 互 斥 地 访问 某 些 临界 资源 。 现 在 ， 
H T, 对 临界 资源 进行 访问 时 ， 被 7 HT. YT, HOG Ty 并 尝试 去 访问 正在 占据 
的 临界 资源 时 ， 由 于 没有 获得 相应 的 互 斥 锁 导 致 被 阻塞 掉 ， 此 时 T, 开始 继续 运 
行 。 一 直到 T, 运行 结束 之 前 ，7, 都 不 能 释放 临界 资源 。 尽 管 的 优先 级 高 于 也 ， 
但 T, 还 是 被 优先 级 比 自己 低 的 7, 阻塞 了 。 在 这 个 例子 中 ，7, 直到 T, 运行 结束 才 
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可 以 运行 。7 被 低 于 自己 优先 级 并 且 不 在 它 的 临界 区 的 任务 阻塞 。 这 就 叫做 优先 
BRE, KRE, RE T, FT, MT, KK, 但 优先 级 反 转 还 是 发 生 了 。 优 先 级 反 
转 的 持续 时 间 并 不 是 以 临界 区 的 长 度 作为 边界 的 。 这 些 例子 都 可 以 用 Levi 仿真 软 
件 进行 仿真 【Sirocic and Marwedel, 2007c], 

为 一 个 优先 级 反 转 的 著名 例子 发 生 在 NASA 的 火星 探 路 者 上 ， 当 火星 探 路 者 正 
在 火星 上 执行 任务 时 ， 共 享 内 存 导致 了 一 个 优先 级 的 反 转 [Jones，1997] 。 
4.1.4.2 优先 级 继承 

优先 级 继承 是 解决 优先 级 反 转 的 一 个 好 办 法 。 这 是 一 个 可 以 在 绝 大 多 数 实时 操 
作 系统 中 都 可 以 使 用 的 、 标 准 的 解决 方法 。 解 决 流程 如 下 : 

1) 通过 任务 的 优先 级 进行 任务 的 调度 。 具 有 相同 优先 级 的 任务 遵从 先 到 者 先 
服务 的 原则 。 

2) 当 任 务 T, 执行 P 操 作 并 且 临 界 资源 已 经 被 任务 T, 获得 时 ，7, 就 会 被 阻塞 
住 。 如 果 T, 的 优先 级 低 于 T, IA T, 继承 T, 的 优先 级 ， 因 此 恢复 执行 。 总 
之 ， 每 个 任务 都 继承 被 自己 阻塞 的 、 最 高 优先 级 任务 的 优先 级 。 

3) 当 任 务 T, 执行 V 操作 时 ， 它 的 优先 级 减少 为 仍 被 它 阻 塞 的 最 高 优先 级 的 
任务 。 假 如 没有 任何 任务 被 7 阻塞 ， 那 么 它 的 优先 级 恢复 成 隐 初始 的 优先 级 。 此 
外 ， 被 互 斥 量 阻塞 的 最 高 优先 级 的 任务 此 时 恢复 执行 。 

4) 优先 级 继承 是 可 传递 的 : 如 果 TIET T, 并且 7, BASE T T, ABA 7, 继承 
T, 的 优先 级 。 

这 样 ， 被 低 优先 级 任务 阻塞 的 高 优先 级 任务 通过 传递 它们 的 优先 级 给 低 优先 级 
的 任务 ， 就 可 以 使 得 低 优 先 级 的 任务 尽 可 能 快 地 释放 信和 号 量 。 

在 图 4.7 所 示 的 示例 中 ， 当 7 执行 P 操 作 时 ，7 将 会 继承 7 的 优先 级 。 这 将 
会 避免 之 前 提 到 过 的 兄 HEE T 时 导致 优先 级 反 转 (ILE 4.8). 
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图 4.8 图 4.7 使 用 优先 级 继承 








图 4.9 显示 了 临界 区 骨 套 的 例子 [Buttazzo, 2002], 








O 有 些 作者 确实 认为 图 4.6 可 以 被 看 作 优 先 级 反 转 。 本 书 更 早 之 前 的 版 本 也 是 这 样 认 为 的 。 
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图 4.9 RERRE 


TERE, E to HA, HES T, 的 优先 级 并 没有 恢复 到 它 最 初 的 优先 级 。 反 之 ， 它 
的 优先 级 提高 到 了 它 所 阻塞 的 任务 的 最 高 优先 级 ， 在 这 一 时 刻 ， 它 的 优先 级 为 T, 
的 优先 级 T, 。 

优先 级 继承 的 传递 如 图 4. 10 所 示 [ Buttazzo, 2002], 
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图 4. 10 优先 级 继承 的 传递 


FE to MHZ, T, eT, ASE, T, 又 被 MAE, Ae T, 继承 了 的 优先 级 Tio 

优先 级 继承 也 使 用 在 ADA 中 ， 当 许多 任务 同时 访问 一 个 临界 资源 时 ， 每 个 任 
务 的 优先 级 都 被 设置 为 优先 级 的 最 大 值 。 

优先 级 继承 也 解决 了 火星 漫步 者 的 问题 :VxWorks 操作 系统 使 用 了 一 个 标志 位 
作为 互 斥 的 原 语 。 这 个 标志 位 被 打开 的 时 候 ， 就 允许 优先 级 的 继承 。 但 是 当 软 件 在 
火星 车 上 开始 运行 时 ， 这 一 位 的 初始 状态 被 设置 为 了 关闭 。 通过 使 用 VxWorks 的 
调试 工具 ， 将 火星 漫步 者 的 这 个 标志 位 设置 为 打开 ， 虽然 此 时 火星 漫步 者 已 经 在 火 
星 上 了 [Jones, 1997], Levi 模拟 软件 也 可 以 用 来 模拟 优先 级 继承 的 情况 [ Sirocic 
and Marwedel, 2007c], 

虽然 优先 级 继承 能 够 解决 很 多 实时 系统 问题 ， 但 是 还 不 能 解决 所 有 的 实时 系统 
的 问题 。 可 能 会 有 大 量 的 任务 拥有 高 优先 级 ， 甚 至 还 有 可 能 会 产生 死 锁 。 优先 级 冲 








140 RAK RRR AA CWB RRR ( 原 书 第 2 版 ) 





顶 协议 [ Sha et al. , 1990] 可 能 会 对 此 有 些 帮 助 ， 但 是 这 需要 任务 在 设计 时 就 对 这 
些 情况 有 一 定 的 预知 。 


4.2 ERIKA 


有 些 租 入 式 系 统 (例如 汽车 系统 以 及 智能 家 具 系 统 ) 需要 所 有 的 任务 都 在 微 
处 理 器 的 托管 下 运行 ?。 出 于 这 个 原因 ， 由 这 些 系 统 的 固件 中 的 操作 系统 所 能 提供 
的 服务 必须 是 一 个 最 小 功能 集 ， 允 许多 线程 执行 周期 性 的 和 非 周 期 性 的 任务 ， 并 且 
要 对 共享 资源 的 竞争 做 好 充分 准备 ， 以 避免 优先 级 反 转 的 现象 。 

上 述 这 些 功能 需求 在 1990 年 由 OSEK/VDX [ OSEK Group, 2010] 联合 定义 形 
成 ， 它 们 定义 了 多 线程 实时 操作 系统 的 最 小 服务 集 ， 并 且 在 8bit 的 微 控制 器 上 实现 
了 一 个 体积 为 1 ~10KB 的 系统 。OSEKZVDX 的 API 最 近 被 AUTOSAR [ AUTOSAR, 
2010] 组 织 进行 了 扩展 ， 扩 展 中 加 入 了 对 时 间 系 统 的 保护 、 调 度 表 时 间 触 发 系统 
以 及 用 于 保护 由 微 处 理 器 托管 下 的 多 任务 之 间 内 存 保护 的 机 制 。 本 节 简 单 地 描述 了 
这 些 系统 的 主要 功能 和 需求 ， 并 基于 一 个 已 经 实现 了 的 开源 实时 操作 系统 ERIKA 
[ Evidence, 2010] 作为 参考 。 

OSEK 内 核 区 别 于 其 他 操作 系统 的 第 一 个 特点 就 是 所 有 内 核 的 部 件 在 编译 时 静态 定 
义 。 特 别 是 ， 大 部 分 该 类 系统 都 不 支持 动态 的 内 存 分 配 以 及 动态 的 线程 创建 。 为 了 帮助 
用 户 去 配置 整个 系统 ，OSEKZVDX 标准 提供 了 一 个 名 叫 OIL 的 配置 语言 ， 指 定 了 必须 
在 应 用 中 实例 化 的 对 象 。 当 应 用 被 编译 时 ，0IL 编译 器 产生 操作 系统 的 数据 结构 ， 分 配 
准确 的 、 实 际 需要 的 内 存 的 大 小 。 这 种 方法 的 好 处 是 应 用 程序 需要 多 少 内 存 就 分 配 多 少 
内 存 ， 并 放 在 闪存 中 (在 大 多 数 的 微 处 理 器 中 ， 闪 存 的 价格 要 比 RAM 更 便宜 )。 

OSEK/VDX 系统 的 第 二 个 突出 特点 是 堆栈 的 共享 。 造 成 堆栈 共享 的 原因 是 
RAM 对 于 微 处 理 需 来 说 过 于 昂贵 。 如 何 实现 堆栈 共享 的 系统 的 关键 在 于 如 何 编写 








任务 代码 。 
对 于 传统 的 实时 系统 来 说 ， 一 个 周期 性 任务 的 典型 实现 一 般 根 据 如 下 的 方案 : 
task(x) { 
int local; 


initialization(); 
for (;;) { 
do_instance(); 


end_instance(); 


上 





”这 部 分 是 G. Buttazzo 和 P. Gai (Pisa) 提出 的 。 
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上 面 的 方案 具有 大 部 分 实时 进程 的 特点 : 一 个 死 循环 ， 其 中 包含 一 个 周期 的 任 
务 ， 这 个 任务 收 到 一 个 阻塞 原 语 (end-instance ()), 这 个 阻塞 原 语 会 阻塞 任务 ， 
直到 任务 下 一 次 被 激活 。 当 看 到 这 样 一 种 编程 架构 (在 OSEK/VDX 中 叫做 扩展 进 
FE) 时 ， 堆 栈 一 直 被 当前 这 个 进程 占据 ， 甚至 进程 休眠 时 也 是 这 样 。 在 这 种 情况 
下 ,堆栈 是 不 能 被 共享 的 ， 这 就 意味 着 ， 每 个 任务 都 要 有 一 个 独立 的 堆栈 。 

当然 ，OSEKZVDX 标准 也 对 基本 的 任务 提供 支持 ， 这 种 任务 执行 起 来 更 像 是 
一 个 函数 的 执行 ， 其 编程 架构 如 下 : 

int local; 
Task x() { 


do_instance(); 


i 


System_initialization() { 





initialization(); 

相 比较 于 扩展 任务 ， 在 基本 任务 中 ， 当 前 状态 必须 由 不 同 的 实例 进行 维护 ， 并 
且 这 些 实例 都 不 存放 在 栈 中 ， 而 是 存放 在 全 局 变量 中 。 并 且 初 始 化 的 部 分 也 放 到 了 
系统 的 初始 化 部 分 中 ， 因 为 任务 并 不 是 动态 创建 的 ， 所 以 这 些 初始 化 的 信息 可 以 在 
系统 启动 时 就 存在 着 。 最 后 ， 任 务 的 下 一 阶段 运行 并 不 需要 通过 同步 原 语 的 控制 进 
行 ， 因 为 任务 实例 化 以 后 就 已 经 一 直 在 运行 了 。 另 外 ， 任 务 不 允许 调用 任何 的 阻塞 
原 语 ， 因 此 任务 要 么 被 更 高 优先 级 的 任务 抢占 ， 要 么 就 一 直 运 行 到 任务 结束 。 这 
样 ， 任 务 就 像 一 个 函数 一 样 ， 在 栈 上 申请 空间 ， 运 行 ， 然 后 释放 空间 。 出 于 这 个 原 
因 ， 任 务 在 两 次 执行 之 间 ， 就 不 需要 一 直 占 据 着 堆栈 ， 人 允许 堆栈 被 系统 所 有 的 进程 
所 共享 。ERIKA 支持 堆栈 共享 ， 允 许 所 有 的 基础 任务 在 同一 系统 中 共享 一 个 堆栈 ， 
这 样 就 可 以 减少 RAM 的 大 小 。 

OSEK/VDX 内 核 在 任务 管理 上 提供 了 固定 优先 级 调度 系统 和 即时 优先 级 上 限 
的 方法 ， 以 避免 优先 级 反 转 的 问题 。 使 用 即时 优先 级 上 限 功能 需要 在 OIL 的 配置 文 
件 中 的 每 个 资源 的 使 用 部 分 进行 配置 。OLI 编译 器 通过 每 个 任务 的 OIL 文件 的 资源 
使 用 声明 来 计算 整个 系统 的 使 用 资源 的 上 限 。 

Fi 9b OSEK/VDX 支持 非 抢 占 式 调度 以 及 抢占 阔 值 以 限制 整体 堆栈 的 使 用 。 限 
制 任务 之 间 抢占 的 主要 原因 是 降低 在 同一 时 间 申 请 系统 堆栈 的 任务 的 数量 ， 更 进 _- 
步 降低 对 整个 RAM 的 需求 。 降 低 系统 的 抢占 性 有 可 能 会 降低 整个 任务 的 可 调度 
性 ， 因 此 系统 的 抢占 程度 必须 衡量 系统 的 调度 性 以 及 整个 系统 的 可 用 RAM 空间 。 

关于 小 型 微 控制 器 上 的 操作 系统 设计 的 另 一 个 要 求 就 是 可 扩展 性 ， 这 意味 着 
APL 的 封装 相对 于 标准 系统 来 说 ， 要 尽 可 能 精炼 ， 以 实现 在 小 内 存 系统 上 的 运行 。 
实际 上 ， 在 大 规模 生产 的 系统 中 ， 内 存 的 总 量 影 响 到 系统 的 总 成 本 。 在 此 背景 
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提出 了 一 个 一 致 性 级 别 的 概念 用 以 对 可 扩展 性 进行 衡量 。 该 概念 用 于 对 操作 系统 的 
API 特定 子 集 进行 定义 。 一 致 性 级 别 可 以 随 着 系统 的 升级 而 进行 扩展 ， 对 于 最 终 的 
系统 目标 可 以 实现 API 封装 的 动态 增 减 。0SEK/VDX 标准 所 提供 的 一 致 性 级 别 
(fH ERIKA 公司 ) 如 下 : 

1) BCC1: 这 是 一 致 分 类 的 最 小 内 核 ， 提 供 了 最 少 8 个 不 同 优 先 级 的 进程 以 及 
一 个 共享 资源 。 

2) BCC2: 相对 于 BCC1 来 说 ， 这 次 的 分 类 添加 了 可 以 拥有 多 个 具有 相同 优先 
级 任务 的 功能 。 每 个 任务 都 可 以 等 待 被 激活 ， 换 言 之 ， 操 作 系统 记录 被 激活 ， 但 尚 
未 执行 的 任务 的 数量 。 

3) ECC1: 与 BCC1 相 比 ， 这 次 的 分 类 加 入 了 可 以 等 待 某 些 特殊 事件 发 生 的 扩 
展 任务 。 

4) ECC2: 这 次 的 分 类 加 入 了 多 种 激活 以 及 扩展 任务 方式 。 

ERIKA 公司 通过 提供 下 面 两 种 一 致 性 分 类 提供 了 更 多 的 一 致 性 类 的 种 类 ; 

1) EDF: 这 种 一 致 性 分 类 不 使 用 固定 优先 级 的 调度 器 ， 而 是 使 用 为 微 处 理 器 
进行 优化 的 、 最 早 到 期 优先 (EFD) 调度 器 ( 见 6.2.2.3 节 )。 

2) FRSH: 这 种 分 类 方式 是 EDF 调度 器 的 扩展 ， 通 过 基于 IRIS 调度 算法 ， 提 
供 一 个 资源 预定 调度 器 [Marzario et al. , 2004], 

OSEK/VDX 系统 另 一 个 有 趣 的 特性 是 系统 提供 了 一 个 API 以 用 于 中 断 的 控制 。 
这 是 OSEK/VDX 与 POSIX 类 系统 最 主要 的 不 同 之 处 ， 对 于 POSIX 系统 来 说 ， 中 断 
是 操作 系统 的 禁区 ， 并 且 没 有 任何 操作 系统 的 API 可 以 用 于 中 断 控制 。 提 供 API 控 
制 中 断 的 一 个 基本 原因 是 微 控制 器 的 用 户 经 常 想 要 直接 去 控制 中 断 的 优先 级 ， 因 此 
能 够 提供 一 种 标准 的 方法 去 控制 中 断 的 使 能 就 显得 非常 重要 了 。 此 外 ，OSEKZVDX 
标准 指定 了 两 种 中 断 服 务 程序 (Interrupt Service Routines, ISR) 的 类 型 

1) 分 类 1: 更 简单 而 且 更 快捷 ， 在 中 断 服 务 程序 的 结尾 部 分 不 去 调用 调度 器 。 

2) 分 类 2: 中 断 服 务 程 序 可 以 调用 一 些 原 语 改变 调度 器 的 行为 。 中 断 服 务 程 序 的 
结尾 处 是 重新 调度 的 调度 点 。 中 断 服务 程序 1 总 是 比 中 断 服务 程序 2 的 优先 级 要 高 。 

OSEK/VDX 内 核 的 另 一 个 特点 是 可 以 移 除 产品 化 后 系统 中 的 一 些 操 作 检 查 点 
和 错误 检查 码 ， 除 此 之 外 ， 还 可 以 定义 钩子 函数 ， 当 系统 中 发 生 指 定 的 事件 时 ， 该 
函数 被 调用 。 当 系统 产品 化 后 ， 移 除 这 些 检 查 点 可 以 让 系统 变 得 效率 更 高 ( 而且 
更 安全 ) 。 

为 了 支持 更 好 的 调试 体验 ，OSEKZVDX 标准 定义 了 一 种 命名 为 ORTI 的 文本 语 
言 ， 该 语言 描述 了 操作 系统 的 各 种 对 象 是 在 哪里 被 分 配 的 。ORTI 文件 一 般 由 OIL 
编译 器 生成 ,并且 由 调试 者 使 用 ， 以 打印 一 些 定义 在 系统 中 的 操作 系统 对 象 的 详细 
言 息 〈 例 如 ， 调 试 者 可 以 打印 应 用 程序 中 的 任务 当前 状态 表 ) 。 

所 有 这 些 定义 在 OSEK/VDX 中 的 标准 ， 都 被 开源 的 ERIKA 企业 版 内 核 [ Evi- 
dence, 2010] 实现 了 。 该 内 核 支持 一 系列 的 找 入 式微 控制 器 ， 并 且 目 标 代码 的 大 
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小 是 1 ~5KB 不 等 。 并 且 ，ERIKA 企业 版 实现 了 一 些 其 他 的 功能 ， 例 如 EDF 调度 
带 ， 提 供 了 一 个 开放 而 且 免 费 的 操作 系统 可 以 用 来 学 习 、 测 试 以 及 实现 一 些 真实 的 
用 例 ， 用 于 工业 以 及 教育 领域 。 


4.3 硬件 抽象 层 


硬件 抽象 层 (Hardware Abstraction Layer, HAL) 提供 了 一 种 通过 硬件 无 关 的 
APL 访问 硬件 的 方法 。 例 如 ， 可 以 提出 一 种 硬件 无 关 的 技术 ， 用 来 访问 时 钟 而 无 需 
考虑 时 钟 被 映射 到 了 哪 块 地 址 空间 上 。 硬 件 抽象 层 主要 用 于 硬件 和 操作 系统 层 之 
间 ， 它们 提供 了 一 种 软件 的 知识 产权 (Intellectual Property > IPD 但 是 它们 既 不 十 
操作 系统 的 一 部 分 也 不 能 归 类 于 中 间 件 。 这 方面 的 相关 工作 由 Ecker、Mailler 和 
Dimer 提供 [Ecker et al. , 2009 | 。 


4.4 中 间 件 


用 于 通信 的 库 针 对 于 缺乏 通信 机 制 的 语言 提供 了 额外 的 通信 手段 ， 它 们 在 操作 
系统 的 基础 之 上 提供 了 通信 功能 。 由 于 添加 在 了 操作 系统 之 上 ， 它 们 可 以 独立 于 操 
作 系 统 〈 而 且 明 显 也 独立 于 底层 的 处 理 器 硬件 ) 。 结 论 就 是 ， 可 以 得 到 一 个 网 络 化 
的 嵌入 式 系统 。 不 仅仅 局 限于 在 系统 内 部 通信 ， 通 信 的 距离 越 来 越 远 也 是 一 种 未 来 
的 发 展 趋势 。 互 联网 协议 的 使 用 也 变 得 越 来 越 受 欢迎 。 


4.4.1 OSEK/VDX COM 


OSEK/VDX COM 是 用 于 OSEK 车 载 操 作 系 统 上 的 通信 标 准 [ OSEK Group, 
2004] 。OSEK COM 提供 了 “交互 层 ” 以 用 于 API。 无 论 是 内 部 通信 (ECU 的 内 
部 通信 ) 还 是 外 部 通信 (与 其 他 ECU 通信 ) ， 都 可 以 使 用 这 套 接口 标准 。，OSEK 
COM 只 指定 了 交互 层 的 功能 。 符 合 规范 的 实现 必然 是 分 别 发 展 的 。 

与 其 他 ECU 的 交互 层 的 通信 要 通过 “网 络 层 ”以 及 “数据 链 路 层 ”，OSEK 
COM 指定 了 一 些 对 这 些 层 的 要 求 及 需求 ， 但 是 这 些 层 自己 并 不 是 OSEK COM 的 一 
部 分 。 通 过 这 种 方式 ， 就 可 以 在 不 同 的 网 络 协议 上 实现 通信 。 

OSEK COM 是 一 个 专用 于 嵌入 式 系统 中 间 件 通信 的 例子 。 除 了 专用 FRANA 
统 的 中 间 件 外 ， 许 多 用 于 非 庶 和 人 式 系统 的 通信 标准 也 同样 适用 于 嵌入 式 系统 


4.4.2 CORBA 








CORBA ® (Common Object Request Broker Architecture , 公共 对 象 请 求 代 理 体 





O OSEK 是 Continental Automotive 公司 的 商标 。 
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系 结构 ) [Object Management Group (OMG) , 2003 ] 可 以 视 作 一 个 采用 上 述 标准 的 
示例 。CORBA 适用 于 远程 的 访问 服务 。 通 过 CORBA， 可 以 使 用 标准 的 接口 访问 远 
程 的 对 象 。 客 户 端 使 用 本 地 的 存根 通信 ， 模 拟 访问 远 端 的 对 象 。 这 些 客户 端 发 送 要 
访问 的 对 象 的 参数 信息 (假如 有 的 话 ) 至 目标 请 求 中 介 (Object Request Broker, 














ORB, WE] 4. 11 ) 。ORB 接 下 来 决定 要 访 EP 
问 对象 的 所 在 地 并 且 通 过 标准 协议 来 发 送 T [| 框架 | 
信息 (例如 IIOP) 至 对 象 所 在 地 。 这 些 信 Tope) ORB? 




















息 通 过 具体 的 链 路 被 发 送 至 对 象 中 ， 当 对 
象 收 到 信息 后 ， 也 会 通过 ORB 将 对 应 的 请 。 图 4 11 使 用 CORBA 访问 远程 对 象 
求 信息 返回 。 

标准 的 CORBA 不 为 实时 应 用 提供 可 预测 性 ， 因 此 ， 实 时 的 CORBA (RT-COR- 
BA) 标准 在 此 情况 下 被 提出 [Object Management Group (OMG) , 2005a] 。RT-CORBA 
的 一 个 基本 特点 是 在 固定 优先 级 的 系统 中 提供 点 到 点 的 时 间 可 预测 性 。 它 包括 了 考虑 
客户 端 和 服务 器 端 争夺 资源 的 线程 优先 级 ， 并 且 设 定 一 个 操作 调用 的 延迟 的 边界 。 

实时 系统 的 另 一 个 典型 问题 是 当 线程 发 生 了 对 临界 资源 的 争 用 时 ， 线 程 的 优先 
级 此 时 有 可 能 失去 作用 。RT-CORBA 必须 解决 优先 级 反 转 的 问题 。RT-CORBA 包含 
了 一 种 当 优先 级 反 转 发 生 时 ， 提 供 一 个 时 间 边 界 的 方法 。RT-CORBA 提供 了 管理 线 
程 优 先 级 的 功能 ， 虽 然 这 个 功能 可 以 与 POSIX 标准 的 实时 扩展 功能 相 容 ， 但 这 个 
优先 级 独立 于 操作 系统 底层 的 优先 级 。 客 户 端 线程 的 优先 级 可 以 被 传送 到 服务 器 
端 ， 优 先 级 管理 也 可 以 用 于 管理 临界 资源 的 原 语 。 刚 刚 描述 过 的 优先 级 继承 的 协议 
是 已 经 在 RT-CORBA 中 实现 并 且 可 用 的 。 线 程 池 的 存在 避免 了 线程 创建 时 的 开销 。 





4.4.3 MPI 


作为 CORBA 的 一 个 蔡 代 方案 ， 信 息 传送 接口 (Message Passing Interface, 
MPI) 也 可 以 用 来 在 不 同 的 处 理 器 之 间 传 递 信 息 。MPI 作为 一 个 使 用 非常 频繁 的 
库 ， 最 初 是 被 设计 用 于 高 性 能 计算 。MPI 基于 消息 传递 的 ， 并 且 人 允许 在 同步 和 异步 
消息 传递 之 间 进 行 选 择 。 例 如 ， 使 用 MPI 库 的 发 送 命令 发 送 同步 消息 [MHPCC, 
2010]: 

MPI Send (buffer, count, type, dest, tag, comm), 其中: 

1) buffer; 要 发 送 数据 的 地 址 。 

2) count: 要 发 送 的 数据 数量 。 

3) type: 要 发 送 的 数据 类 型 (例如 ，MPI 字符 、MPI 短 整 型 、MPI 整形 ) 。 

4) dest: 要 发 送 的 目标 进程 的 进程 ID。 

5) tag: 消息 的 ID 〈 用 来 对 传人 消息 进行 排序 ) 。 

6) comm: 通信 的 上 下 文 (一 组 处 理 过 程 ， 用 来 判定 消息 目的 地 是 否 合法 )。 

7) Function result; 成 功 与 否 的 返回 值 。 
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下 面 是 异步 消息 传输 的 库 函数 : 

MPI send (buffer, count, type, dest, tag, comm, request), Hef, 

1) buffer, count, type, dest, tag, comm: 同上 所 述 。 

2) 这 里 的 系统 都 有 一 个 独特 的 “request number”。 程 序 员 使 用 这 个 系统 分 配 
“handle” (7E WAIT 类 型 中 ) 用 以 确定 非 阻塞 的 操作 是 否 完成 。 

对 于 MPI 而 言 ， 在 不 同 的 处 理 器 之 间 分 区 计算 必须 要 明确 的 完成 ， 并 且 通 信 
和 数据 的 分 布 也 同样 如 此 。 同 步 过 程 一 般 都 隐 含 在 了 通信 中 ， 但 是 明确 的 同步 也 是 
有 可 能 发 生 的 ， 结 果 程序 员 要 把 大 量 的 工作 放 在 对 代码 的 管理 中 。 因 此 也 不 能 对 众 
多 发 生变 化 的 进程 进行 衡量 [ Verachtert, 2008 ] 。 

为 了 在 实时 系统 中 部 署 MPI 方式 的 通信 ， 一 个 被 作 MPVRT 的 MPI 实时 版 本 被 定 
X [MPI/RT forum, 2001], MPI-RT 没有 覆盖 RT-CORBA 的 所 有 方面 ， 例 如 线程 的 创建 
和 终结 。MPL RT 被 认为 是 在 操作 系统 和 标准 ( 非 实时 ) MPI 之 间 的 一 个 潜在 的 层 。 

MPI 可 以 在 不 同 的 平台 上 使 用 ， 并 且 也 可 以 在 片上 多 处 理 器 系统 中 运行 。 然 
而 ， 它 基于 了 内 存 访 问 的 速度 要 比 通 信 操 作 的 速度 要 快 得 多 的 假设 。 另 外 ，MPTI 主 
要 针对 同 质 多 处 理 器 ， 这 些 假设 并 不 适用 于 片上 多 处 理 器 系统 。 


4.4.4 POSIX 线程 (Pthreads) 


POSIX 线程 库 是 操作 系统 级 的 线程 应 用 编程 接口 (API) [ Bamey, 2010], 
Pthread 遵守 IEEE POSIX 1003. le 操作 系统 标准 ， 一 组 线程 可 以 运行 在 同样 的 地 址 
空间 中 ， 因 此 就 可 以 基于 共享 内 存 实现 通信 了 。 这 样 就 避免 了 MPL 中 需要 做 到 的 
内 存 复 制 操作 ， 因 此 这 个 库 就 更 适用 于 共享 同一 地 址 空间 的 多 核 处 理 器 编程 。 
POSIX 库 也 包含 了 关于 互 斥 操作 的 标准 API。Pthread 使 用 完全 明确 的 同步 【Ver 
achtert, 2008 ] ， 具 体 的 语义 取决 于 内 存 一 致 性 模型 的 使 用 。 正 确 地 进行 同步 编程 
是 一 件 比较 困难 的 事情 ，POSIX 库 可 以 作为 其 他 编程 模型 的 后 端 。 

4.4.5 OpenMP 

对 于 OpenMP， 并 行 性 是 其 主要 特征 ， 计 算 划 分 、 通 信 以 及 同步 等 ， 相 对 而 言 
都 是 次 要 的 。 并 行 性 需要 添加 一 些 编译 指示 来 表达 : 例如 ， 循 环 之 前 可 以 加 入 编译 
指示 ， 以 表明 它们 可 以 并 行 执行 。 下 面 的 这 段 程序 展示 了 一 小 段 并 行 循环 编程 


[ OpenMP Architecture Review Board, 2008 ] : 
void a1(int n, float *a, float *b) 


{int i; 
# pragma omp parallel for 
for (i=1; i<n; i++) /* i PLAT BRIA */ 
b[i] = (alil + afi-1]) / 2.0; 


} 
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这 意味 着 〈 在 上 面 刚刚 提出 的 方法 ) OpenMP 需要 一 点 点 的 工作 就 可 以 为 用 户 
提供 并 行 化 的 编程 ， 然 而 这 也 意味 着 用 户 不 能 很 好 地 控制 这 些 部 分 [ Verachtert, 
2008 |, OpenMG 针对 的 是 共享 内 存 的 硬件 ， 这 是 MPSoCs 上 的 第 一 个 应 用 (可 以 
参考 [Marongiu and Benini, 2009] 的 例子 ) 。 





4.4.6 UPnP, DPWS 和 JXTA 


通用 即 插 即 用 (UPnP) 已 经 将 即 插 即 用 的 概念 从 PC 发 展 到 了 设备 与 网 络 的 
互 连 中 。 很 容易 看 到 ， 通 过 网 络 互 连 家 中 和 办 公 室 的 打印 机 、 存 储 空间 等 已 经 是 一 
个 未 来 发 展 的 基本 趋势 了 [UPnP Forum, 2010]。 出 于 安全 问题 ， 只 有 数据 之 间 的 
交换 ， 代 码 是 不 能 被 传输 的 。 

Web 服务 设备 配置 文件 ( Devices Profile for Web Services, DPWS) 的 目标 是 比 
UPnP 做 得 更 加 通用 。“ DPWS 被 设计 用 来 在 资源 受 限 的 设备 上 使 能 安全 的 Web 服务 
(WS) 能 力 ” [ws4d, 2010]. DPWS 指定 了 发 现 设 备 并 连接 到 网 络 上 的 服务 ， 用 
于 交换 可 用 的 服务 的 信息 以 及 发 布 、 描 述 事件 。 

除 此 之 外 ， 几 个 综合 的 网 络 通信 库 可 以 用 于 高 性 能 计算 服务 设计 (High-Per- 
formance Computing, HPC) 。 这 些 库 特 别 适 用 于 低 耦 合 的 基于 互联 网 的 通信 协议 。 
JXTAT M [JXTA Community, 2010] 就 是 一 个 开源 的 、 点 对 点 的 协议 规范 。 这 个 协 
议 由 一 组 XML 消息 定义 ， 它 允许 任何 设备 链接 到 网 络 上 的 某 个 端点 进行 信息 的 交 
换 ， 并 且 可 以 与 独立 的 网 络 拓扑 结构 进行 合作 。JXTA 创建 了 一 个 虚拟 的 覆盖 网 络 ， 
允许 一 个 点 与 其 他 的 点 进行 交互 ， 甚 至 当 某 些 节 点 或 者 资源 位 于 防火 墙 后 ， 也 可 以 
进行 交互 。JXTA 的 名 字源 于 单词 “juxtapose”。 

CORBA, MPI, Pthreads, OpenMP, UPnP, DPWS 以 及 JXTA 都 是 一 些 通 信 
中 间 件 (用 于 操作 系统 以 及 应 用 程序 之 间 的 软件 层 )。 最 初 ， 这 些 中 间 件 都 被 设 
计 用 来 进行 桌面 电脑 之 间 的 通信 ， 然 而 它们 正在 试图 去 影响 嵌 人 式 系统 上 的 知识 
以 及 技术 。 对 于 一 些 移动 设备 ， 例 如 智能 手机 ， 使 用 上 面 的 方法 可 能 就 是 比较 恰 
当 的 。 对 于 “和 硬 实 时 系统 ”来 说 ， 它 们 的 开销 、 实 时 性 以 及 所 提供 的 服务 就 未 
必 适 合 了 。 








45 实时 数据 库 


数据 库 提 供 了 一 种 方便 、 结 构 化 的 方法 存储 和 访问 信息 。 因 此 ， 数 据 库 提 供 了 
API 用 于 进行 数据 的 读 写 操作 。 一 系列 的 读 和 写 的 操作 被 称 为 事物 ， 事物 失败 的 原 
因 有 很 多 种 : 有 可 能 是 硬件 原因 所 导致 ， 有 可 能 是 死 锁 ， 或 者 是 并 发 控制 问题 等 。 
除非 事物 执行 到 了 非常 安全 的 结束 时 期 ， 和 否则 事物 不 会 对 数据 库 的 状态 产生 任何 影 
啊 。 因 此 ， 由 事物 引发 的 变化 通常 不 认为 是 一 次 处 理 的 终结 ， 除 非 事 物 已 经 被 提 
交 。 大 多 数 的 事物 一 般 都 需要 原子 操作 。 这 意味 着 ， 由 事物 产生 的 一 些 最 终结 果 
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(数据 库 的 新 状态 ) 必须 是 要 么 就 是 事物 完全 执行 完毕 ， 要 么 就 是 事物 跟 未 执行 前 
的 状态 一 致 。 另 外 ， 由 事件 引起 的 数据 库 状 态 必须 是 一 致 的 。 一 致 性 需求 包括 ， 例 
如 ， 相 同 的 事物 发 出 的 读 请 求 的 值 ， 必 须 是 一 致 的 (不 要 描述 一 个 数据 库 模 拟 出 
来 的 不 存在 的 环境 ) 。 此 外 ， 对 于 其 他 的 数据 库 用 户 来 说 ， 没有 中 间 状 态 造 成 的 部 
分 事物 的 执行 必须 是 可 见 的 (事物 必须 就 像 独立 执行 的 那样 被 执行 ) 。 最 终 ， 事 物 
对 数据 库 的 改变 应 该 是 永久 的 ， 这 个 属性 又 被 称 为 事物 的 持久 性 。 同时 ， 上 面 用 黑 
体 标 出 来 的 四 个 属性 被 称 作 数据 库 的 ACID 属性 (参见 Krishna 与 Shin [ Krishna and 
Shin, 1997] 所 著 书 籍 第 5 章 ) 。 

对 于 某 些 数据 库 来 说 ， 有 软 实 时 的 限制 ， 例如 航空 订 票 系统 的 时 间 限 制 就 是 软 
实时 的 。 与 此 相反 ， 也 有 一 些 硬 实时 限制 的 数据 库 ， 例如 汽车 应 用 中 的 自动 行人 识 
别 系统 以 及 军事 上 的 目标 识别 系统 软件 ， 就 必须 是 硬 实时 系统 限制 。 上 面 所 说 的 那 
些 要 求 很 难保 证 硬 实时 的 限制 。 例 如 ， 在 事物 被 提交 前 ， 事物 就 有 可 能 在 不 同 的 时 
间 被 终止 了 。 所 有 的 数据 库 都 依赖 于 页 请 求 以 及 硬盘 ， 访问 硬盘 的 时 间 非 常 难以 预 
测 。 一 个 可 能 的 解决 方法 就 是 使 用 贮存 数据 库 以 及 通过 使 用 闪存 进行 预测 。 mAs 
数据 库 有 时 足够 小 ， 以 确保 能 够 使 用 上 述 方法 。 想 了 解 更 多 的 信息 ， 请 参考 Krish- 
na 以 及 Shin 所 编写 的 书籍 。 


4.6 思考 题 


1. 都 有 哪些 需求 必须 需要 一 个 实时 操作 系统 ? 如 何 区 分 标准 操作 系统 与 实时 
操作 系统 的 需求 的 不 同 ? 

2. 自从 1958 年 以 来 ,一 共有 和 多少 秒 在 除夕 用 来 补偿 UTC 与 TAI 时 间 的 不 同 ? 
你 可 以 通过 互联 网 来 寻找 问题 的 答案 。 

3. 在 RTOS 中 ， 类 似 于 Windows 或 者 Linux 这 样 的 标准 操作 系统 的 哪些 特征 会 
被 抛弃 ? 

4. 找 出 使 用 了 内 存 保护 单元 的 处 理 机 ! 内 存 保护 单元 与 更 加 常用 的 内 存 管理 
单元 (MMU) 的 区 别 是 什么 ?你 可 以 通过 使 用 互联 网 来 搜寻 相关 的 答案 。 

5. 描述 一 下 这 么 多 种 类 的 租 入 式 系 统 ， 哪 种 保护 方式 必须 被 提供 ! 描述 一 下 
这 些 系统 中 ， 哪 种 保护 方式 我 们 可 以 不 需要 提供 ! 

6. 举 一 个 具有 三 个 任务 的 系统 中 ,产生 优先 级 反 转 的 例子 。 

7. 从 Levi 的 网 站 [Sirocic and Marwedel, 2007c ] 所 下 载 的 Levi 的 学 习 模 块 Le- 
viRTS 模拟 如 图 4. 12 描述 的 进程 集 。 
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指令 序列 
任务 | 优先 级 | 目的 地 | 运行 时 间 Piste es 
| Ti 1( 高 ) | 3 4 r 
7 2 10 3 1 2 
T3 3 6 4 6 
T, 4 低 ) | o0 7 : 
图 4. 12 任务 专用 资源 请 求 设置 





tp,p 以 及 tp.c 是 相对 于 开始 的 时 间 ， 这 里 有 任务 分 别 独立 请 求 使 用 打印 系统 或 是 
通信 线路 (在 Levi 中 被 称 作 A tP) ， 恬 "以 及 图 c 与 资源 被 释放 的 时 间 有 关 。 使 用 基 
于 优先 级 的 抢占 调度 将 会 导致 什么 问题 发 生 ? 如 何 解决 这 个 问题 ? 

8. 在 网 络 中 间 件 的 设计 中 ， 发生 优 先 级 反 转 会 产生 什么 样 的 影响 ? 

9. 闪存 会 对 实时 数据 库 的 设计 产生 什么 样 的 影响 ? 


第 5 章 评估 和 验证 
5.1 简介 


5.1.1 范围 


规格 说 明 书 、 硬 件 平台 以 及 系统 软件 告诉 人 们 ， 究 竞 可 以 用 哪些 基础 材料 来 设 
计 般 入 式 系统 。 在 设计 过 程 中 ， 必 须 相 当 频 繁 地 去 对 设计 进行 评估 以 及 验证 。 因 
此 ， 在 进入 设计 阶段 之 前 ， 必 须 描 述 如 何 进行 评估 以 及 验证 。 尽 管 评 估 和 验证 之 间 
有 很 多 区 别 ， 但 是 它们 有 着 相当 紧密 的 联系 。 
定义 : 验证 是 检查 一 个 特定 的 〈 某 些 部 分 ) 设计 是 否 符合 需求 、 符 合 所 有 的 约束 
以 及 按照 预期 执行 的 一 个 过 程 。 
定义 : 经 过 数学 严格 计算 过 的 验证 被 称 作 核实 。 

对 于 任何 程序 设计 来 说 ， 验 证 都 是 非常 重要 的 。 几 乎 没有 任何 系统 能 够 在 设计 
阶段 不 经 过 验证 就 能 够 按照 预期 运行 。 在 安全 相关 的 向 入 式 系统 中 ， 验 证 更 显得 极 
其 重要 。 理 论 上 ， 可 以 尝试 去 设计 一 个 总 是 可 以 根据 规格 说 明 书 而 形成 正确 实现 的 
验证 工具 。 实 际 上 ， 除 了 一 些 极其 简单 的 场景 外 ， 这 种 验证 工具 几乎 无 法 满足 要 
求 。 因 此 ， 每 一 个 设计 都 要 进行 验证 。 为 了 最 小 化 必须 验证 的 设计 的 数量 ， 可 以 学 
试 在 设计 过 程 的 最 后 去 进行 验证 。 不 幸 的 是 ， 这 种 方法 也 经 常 不 能 工作 ， 由 于 在 基 
于 规格 说 明 书 的 、 抽 象 的 系统 设计 阶段 与 实现 阶段 有 着 巨大 的 差别 ， 因 此 就 需要 在 
不 同 的 设计 阶段 进行 验证 工作 〈 见 图 5$. 1) 。 验 证 和 设计 工作 应 当 交 织 在 一 起 进行 ， 
而 不 能 认为 是 两 个 相互 独立 的 活动 。 
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假如 能 够 有 一 个 能 够 适用 于 所 有 验证 问题 的 验证 工具 就 好 了 。 实 际 上 ， 没 有 哪 
个 可 用 的 技术 能 够 解决 所 有 的 问题 ， 一 般 都 是 若干 种 技术 混合 使 用 。 从 本 章 的 5. 6 
节 开 始 ， 会 展示 一 系列 可 使 用 的 关键 技术 ， 这 些 技术 会 让 人 们 对 评估 技术 有 一 个 总 
体 的 了 解 。 
定义 : 评估 是 对 一 个 特定 (有 可 能 是 部 分 ) 设计 的 一 些 关 键 特征 (或 者 是 目标 ) 
进行 信息 的 定量 计算 的 过 程 。 


5.1.2 多 目标 优化 


设计 评估 通常 会 导致 对 同一 个 特征 产生 出 若干 的 设计 方案 ， 例 如 平均 执行 时 间 
和 最 差 执行 时 间 的 案例 、 系 统 的 功 耗 、 代 码 的 大 小 、 可 靠 性 以 及 安全 性 。 将 所 有 这 
些 条 件 放 入 一 个 目标 方案 〈 例 如 通过 使 用 加 权 平 均 数 ) 中 通常 是 不 现实 的 ， 因 为 
这 将 隐藏 某 些 设计 的 基础 特征 。 当 然 ， 明 智之 举 是 让 设计 师 来 决定 ， 究 竟 哪 组 设计 
方案 更 加 可 行 。 这 些 设计 中 应 该 只 包含 合理 的 设计 。 多 目标 优化 技术 的 目的 就 是 找 
到 这 样 一 组 合适 的 设计 。 

为 了 执行 多 目标 最 优化 设计 ， 认 为 一 个 m 维度 的 空间 XX 是 优化 问题 的 可 行 解 
决 方案 。 这 些 维度 可 以 反映 一 些 如 处 理 器 的 数量 、 内 存 的 大 小 、 总 线 的 类 型 等 。 对 
于 空间 来 说 ， 定义 了 一 个 n 维 的 函数 ， 评 估 就 若干 标准 及 目标 进行 设计 (例如 
系统 开销 以 及 性 能 ) : 

f (x) = GF (x), e, fa (x)) 

式 中 ，x EX。 

是 这 些 目 标 在 n 维 空 间 的 值 (也 被 称 作 目标 空间 ) 。 假 设 ， 对 每 个 目标 来 
说 ， 最 终 的 总 的 请 求 < 对 应 的 反馈 < - 被 定义 的 请 求 。 接 下 来 ， 假 定 目标 是 最 小 化 


的 对 象 。 
定义 : 向 量 &= (w, +, u) e 五 支配 向 量 y= (v, =, n) cF, MRuthy 
“适用 ”: 
Viell,,n|: wsv A (5.1) 
Jie{1, e,n}: u; <v; (5.2) 


定义 : WR u 与 » 都 不 属于 v， 则 向 量 we F RRES E v eF AEN, 
定义 : WRIA ye X BBu=f (x) 属于 vy =f (y), Wx eX 被 称 作 与 XX 有关 的 帕 
累 托 最 优 (Pareto-optimal) 。 

之 前 的 公式 定义 了 在 解 空间 的 帕 累 托 最 优 。 接 下 来 的 公式 可 以 用 于 目标 空间 的 
系统 优化 。 
定义 : 让 SCF 作为 目标 空间 的 一 组 向 量 。 如 果 v 不 是 属于 5 的 任何 元 素 , Mv | F 
被 称 作 与 $ 相关 的 非 控 解 。 如 果 v 不 属于 解决 方案 的 任意 自己 ， 则 v 被 称 作 帕 累 
托 最 优 。 

图 5.2 给 出 了 相对 于 解 空间 ， 突 出 了 目标 空间 的 不 同方 面 。 
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O2 (如 内 存 空 间 ) O2 (如 内 存 空间 ) 
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无 关 紧 要 的 | 主要 是 低劣 的 设计 
ih 4o 
无 关 紧要 的 

优良 的 设计 

> > 

< h Ol 所 一 一 最 小 Ol 

(如 能 量 ) (如 能 量 ) 
a) b) 


图 5.2 帕 累 托 点 和 帕 累 托 前 沿 
a) 帕 累 托 点 b) 帕 累 托 前 沿 


右上 方 的 区 域 与 设计 空间 的 优化 相对 应 (1) ， 因 此 处 于 此 空间 的 方案 与 其 他 
方案 相 比 效率 较 差 。 左 下 方 矩 形 空间 (如果 此 处 有 元 素 存 在 ) 的 效率 要 优 于 其 他 
的 空间 坐标 域 。 位 于 左上 角 和 右 下 角 的 元 素 无 需 关注 ， 这 些 元 素 仅仅 用 于 与 较 差 的 
或 者 较 好 的 优化 方案 进行 对 比 使 用 。 图 5.2b 显示 了 一 组 帕 累 托 点 ， 也 就 是 所 谓 的 
帕 累 托 前 沿 。 

基于 帕 累 托 点 的 设计 空间 研究 ( Design Space Exploration, DSE) 可 以 帮助 设计 
者 找到 帕 累 托 最 优 的 设计 方案 ， 也 允许 设计 者 在 大 量 的 可 用 的 实施 方案 中 进行 
选择 。 


5.1.3 相关 目标 


对 于 PC 类 系统 来 说 ， 在 新 系统 的 设计 中 ， 平均 性 能 预测 扮演 着 主导 角色 。 对 
于 嵌 人 式 物理 子 系统 来 说 ， 需 要 更 多 地 考虑 多 目标 处 理 。 下 面 的 各 向 说 明了 这 些 目 
标 是 否 以 及 在 本 书 的 哪里 进行 讨论 : 

1) 平均 性 能 : 对 目标 的 分 析 经 常 基于 仿真 。5.6 节 将 简单 地 提出 一 些 有 关 仿 
真 的 问题 。 大 量 的 在 仿真 系统 上 的 〈 特 别 是 在 异 构 系 统 、 物 理子 系统 ) 有 关 信 息 
是 可 以 见 到 的 。 由 于 大 量 的 物理 效应 ， 想 提出 一 个 完整 的 参考 列表 几乎 是 不 可 
能 的 。 

2) 最 坏 情况 下 的 性 能 /实时 行为 : 在 5.2.2 节 ， 将 会 看 到 aiT 时 间 分 析 工 具 的 
详细 介绍 。 

3) 功 耗 : 关于 这 一 技术 的 简要 概述 将 在 5. 3 节 子 以 呈现 。 

4) 温度 / 热 行为 : 将 在 5. 4 节 中 就 此 主题 做 一 个 简单 的 介绍 。 

5) 可 靠 性 : 在 5.5 节 中 ， 可 以 找到 有 关 可 靠 性 理论 的 介绍 。 

6) 电磁 兼容 性 : 本 书 将 不 会 提 及 此 类 内 容 。 

7) 数值 精度 : 在 一 些 应 用 程序 中 ， 一 些小 的 数值 精度 误差 是 可 以 容忍 的 。 容 
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狼 这 种 精度 上 的 损失 可 以 提升 其 他 部 分 的 设计 。 例 如 ， 将 会 在 7. 2. 1 节 讨 论 浮 点 数 
到 定点 数 结构 的 转换 。 还 有 一 些 其 他 的 类 似 情况 也 是 存在 的 。 

8) 可 测试 性 : 测试 系统 的 成 本 可 能 非常 巨大 ， 有 时 甚至 会 超过 生产 成 本 。 因 
此 在 进行 系统 设计 时 就 要 开始 考虑 测试 问题 。 将 会 在 第 8 章 中 讨论 测试 。 

9) 成 本 : 本 书 不 考虑 硅 面 积 以 及 实际 的 金钱 花费 。 

10) FB. BR. DAE TERE REE Rete, RE: 本 书 也 未 
提 及 此 类 相关 内 容 。 

当然 ， 实 际 的 需求 有 可 能 比 上 面 列 出 的 内 容 要 更 多 。 接 下 来 的 内 容 将 提出 一 些 
基于 最 差 情况 的 性 能 评估 方法 。 


5.2 性 能 评估 


性 能 评估 旨 在 预测 系统 的 性 能 。 这 是 一 个 重大 的 挑战 (特别 是 对 于 物理 子 系 
统 而 言 ) ， 因 为 可 能 需要 对 最 坏 的 情况 进行 预测 ， 而 不 仅仅 是 通常 系统 的 整体 性 
能 。 这 些 信息 是 必需 的 ， 因 为 必须 要 保证 系统 的 实时 约束 。 


5.2.1 早期 阶段 


有 两 种 技术 方法 可 以 用 来 为 了 在 系统 的 早期 设计 阶段 就 获得 性 能 信息 : 

1) 估算 成 本 和 性 能 值 : 相当 数量 的 评估 方法 已 经 基于 此 目的 被 开发 ， 例 如 
Jha 与 Dutt [Jha and Dutt, 1993] 为 硬件 所 作 的 此 类 工作 ，jJain 等 人 [Jain et al. , 
2001] 以 及 Franke [Franke，2008] 在 软件 上 所 作 的 此 类 工作 。 若 想 估算 的 值 尽量 
准确 ， 需 要 相当 大 的 努力 才 行 。 

2) 实际 成 本 和 性 能 值 : 可 以 使 用 真正 的 软件 代码 (以 二 进 制 的 形式 ) 在 非常 
接近 真实 硬件 的 平台 上 运行 。 假 如 “软件 合成 工具 ”( 编译 器 ) 和 硬件 合成 工具 的 
接口 存在 ， 这 几乎 是 惟一 的 可 能 。 这 种 方法 相对 于 之 前 的 方法 估算 更 加 的 精确 ， 但 
会 较 大 地 (有 时 是 极 大 地 ) 增加 时 间 开 销 。 

为 了 获得 足够 准确 的 信息 ， 通 信 开 销 也 应 该 被 考虑 进来 。 但 不 幸 的 是 ， 很 难 在 
系统 的 早期 设计 阶段 去 计算 通信 的 消耗 。 


5.2.2 WCET 估算 


人 研究 人 员 提 出 了 一 种 正式 进行 性 能 评估 的 技术 。 在 租 入 式 系统 上 ，Thiele 等 
A, Henia 和 Ernst 等 人 以 及 Wilhelm 等 人 做 了 与 此 相关 的 研究 (参见 [Thiele 
2006b], [Henia et al. , 2005], and [ Wilhelm ，2006] ) 。 这 些 技术 需要 对 一 些 知识 
架构 有 了 解 ， 这 些 技术 并 不 适合 在 系统 的 极 早期 阶段 介入 ， 但 是 其 中 的 一 些 方法 可 
以 在 对 目标 系统 没有 详细 了 解 时 就 使 用 。 这 些 方法 模拟 真实 、 物 理 的 时 间 。 

任务 调度 需要 对 任务 的 执行 时 间 有 一 定 的 了 解 ， 特 别 是 在 实时 系统 中 ， 要 保证 
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时 间 约 束 性 。 最 坏 情 况 下 执行 时 间 (Worst Case Execution Time, WCET) 是 大 多 数 
调度 算法 的 基础 。 双 CET 的 相关 定义 如 图 5.3 所 示 。 

最 坏 情况 下 执行 时 间 是 一 个 程 分 布 的 执行 时 间 
序 从 有 任何 输入 和 最 初 的 执行 状态 





下 最 长 的 执行 时 间 。 但 不 幸 的 是 ， BCET WCET 

WCET 一 般 都 极其 难以 进行 计算 。 | | 

一 般 来 说 ， 很 难 判定 WCET 是 否 是 zi 
有 穷 的 。 显 而 易 见 的 事实 是 ， 它 无 。 BCETsgsr WCET pep 
法 判定 一 个 程序 是 否 结束 ， 因此 图 5.3 WCET 相关 条 款 


WCET 只 能 用 于 某 些 程序 /任务 的 
计算 。WCET 只 能 计算 如 没有 递归 的 程序 、 没 有 While 循环 的 程序 以 及 有 明确 的 迭 
代数 的 循环 。 假 如 有 上 述 的 限制 ， 计 算 WCET 几乎 是 一 件 不 可 能 完成 的 任务 。 现 
代 处 理 咒 的 流水 线 架 构 带 来 的 危害 以 及 存储 的 结构 导致 有 限 的 可 预计 的 命中 率 使 得 
几乎 无 法 在 设计 时 进行 准确 的 预测 。 计 算 系 统 的 WCET 包含 缓存 、 流 水 线 、 中 断 
以 及 虚拟 内 存 的 预测 ， 这 是 一 个 更 大 的 挑战 。 所 以 ， 如 果 能 够 计算 出 WCET 的 上 
界 ， 那 么 这 真是 一 件 值得 高 兴 的 事情 。 

这 个 上 界 通 常 称 为 估算 的 最 坏 情 况 执行 时 间 ， 或 者 WCETsst。 这 种 边界 应 该 具 
有 至 少 两 种 属性 : 

1) 边界 应 该 是 安全 的 (WCETjsw 宇 WCET); 

2) 边界 应 该 严格 (WCET ys, - WCET < WCET), 

注意 ， 术 语 “ 估 计 ” 并 不 意味 着 得 到 的 时 间 是 不 安全 的 。 

有 时， 架构 的 特征 也 会 降低 平均 执行 时 间 ， 但 是 这 并 不 能 保证 在 实时 设计 中 完 
全 忽略 WCET。 计 算 精准 的 执行 上 界 的 时 间 依 旧 很 困难 。 上 面 提 到 的 设计 架构 在 计 
算 WCETEst 时 依旧 存在 困难 。 

因此 ， 最 佳 执行 时 间 (Best- Case Execution Time, BCET) 以 及 相对 应 的 估算 
BCETresr 以 类 似 的 方式 被 定义 。BCETis 是 一 种 安全 并 且 严 格 的 执行 时 间 的 下 界 。 

通过 使 用 高 级 语言 ， 例 如 C 语言 而 没有 任何 汇编 语言 的 知识 或 者 是 底层 平台 
架构 的 知识 而 去 计算 紧 界 是 不 可 能 的 。 因 此 ， 安 全 的 分 析 必 须 从 真实 的 机 器 码 开 
始 ， 任 何其 他 的 方法 都 会 导致 不 安全 的 结果 。 

接 下 来 将 要 更 加 紧密 地 学 习 WCET 估算 。 接 下 来 将 描述 了 基于 R. Wilhelm 
[ Wilhelm, 2006] 所 开发 的 工具 aiT, aiT 的 结构 如 图 5.4 所 示 。 

与 所 讨论 的 高 级 语言 的 问题 一 致 ，aiT 由 代码 组 成 的 可 执行 文件 开始 进行 分 
析 。 从 这 些 代码 中 可 以 提取 出 控制 流 图 (Control-Flow Graphn，CFG ) 。 接 下 来 循环 
转换 被 应 用 ， 它 包括 对 循环 和 递归 函数 调用 的 转换 以 及 虚拟 循环 展开 。 被 称 作 
“虚拟 ”展开 的 原因 是 它 是 在 内 部 执行 的 ， 而 没有 实际 修改 过 的 代码 运行 。 它 可 以 
用 CRL (Control flow Representation Language， 控 制 流 表示 语言 ) 格式 代表 。 接 下 
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循环 变换 (Loop trafo) 


静态 分 析 路 径 分 析 
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SIR /eR 


ILP 发 生 器 循环 边界 
| 数据 分 析 器 < AIP 文 件 a 
ILP 求 解 


缓存 /传递 途径 (pipeline) 
分 析 器 


图 5.4 aiT 时 间 分 析 工 具 架 构 


来 的 阶段 采用 了 不 同 的 静态 分 析 ， 静 态 分 析 读 取 包 含 设计 者 注释 的 AIP 文件 。 这 些 
注释 所 包含 的 信息 很 难 或 者 说 无 法 自动 的 从 代码 中 提取 (如 复杂 的 循环 边界 ) 。 静 
态 分 析 包 括 了 数值 、 缓 存 以 及 流水 线 的 分 析 。 
数据 分 析 计算 一 个 封闭 间隔 内 的 寄存 器 以 及 本 地 变量 中 可 能 出 现 的 值 。 其 结论 
可 用 于 控制 流 分 析 以 及 数据 缓存 分 析 。 通 常 来 说 ， 像 地 址 这 样 的 信息 一 般 都 非常 精 
确 地 知道 了 (特别 是 对 “干净 的 ”代码 来 说 ) ， 这 对 内 存 访问 的 预测 非常 有 帮助 。 
下 面 是 对 缓存 以 及 流水 线 的 分 析 。 在 下 面 将 介绍 一 些 有 关 缓 存 分 析 的 细节 。 
假设 使 用 ”路 的 组 相关 缓存 〈 见 图 5.5)9 。 
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图 5.5 组 相关 缓存 (n=4) 











O ”假设 本 书 的 读者 对 于 缓存 的 相关 概念 非常 熟悉 。 
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这 里 认为 这 部 分 ( 行 ) 的 缓存 与 特定 的 索引 相对 应 ( 见 图 5.5 黑体 部 分 )。 假 
定 被 换 出 缓存 的 那 部 分 数据 是 被 近期 最 少 使 用 策略 (Least Recently Used, LRU) 
换 出 的 。 这 意味 着 所 有 的 缓存 中 的 数据 都 分 别 对 应 着 一 个 它们 各 自 的 、 特 殊 的 引 
用 。 最 后 的 ”意味 着 内 存 块 就 存放 在 缓存 的 这 些 部 分 中 。 这 里 认为 LRU 硬件 管理 
着 所 有 的 索引 ， 并 且 每 个 索引 都 与 其 他 索引 都 是 独立 的 。 在 这 种 假定 下 ， 每 一 块 特 
定 的 索引 的 换 出 都 是 与 其 他 索引 的 状况 完全 独立 的 。 这 种 独立 性 是 非常 重要 的 ， 因 
为 它 允 许 人 们 独立 地 去 考虑 每 一 个 索引 。 

现在 考虑 一 部 分 缓存 以 及 一 个 特定 的 索引 。 假 如 有 每 一 个 缓存 通路 〈 列 ) 的 
言 息 。 此 外 ， 考 虑 到 控制 流 的 加 入 。 当 部 分 缓存 加 入 后 ， 能 知道 什么 呢 ? 必须 在 可 
能 以 及 必需 的 信息 中 进行 相应 的 分 析 并 分 辨 。 必 须 的 分 析 显示 了 必须 在 缓存 中 的 条 
目 。 在 计算 WCET 时 ， 这 些 信 息 就 非常 有 意义 了 。 可 能 的 结果 表明 了 有 可 能 在 组 
存 中 的 条 目 。 这 些 信息 特别 用 于 推断 某 些 特定 的 信息 确实 不 在 缓存 中 。 这 些 知识 在 
计算 BCET 中 特别 有 效 。 作 为 “必须 ”以 及 “可 能 ”的 分 析 的 例子 ， 认 为 “必须 ” 
的 信息 位 于 控制 流 中 。 图 5. 6 显示 了 相应 的 情况 。 左 边 的 这 些 条 目 被 看 作 比 右边 的 
条 目 后 进入 缓存 。 


|i | fe) Lia | ta 交叉 + 最 大 使 用 上 限 


— Se [o [tac ft | 
a [0 [ion fo 


图 5.6 LRU 缓存 在 程序 结合 点 的 必须 分 析 


























在 图 5.6 中 ， 内 存 对 象 c 被 看 作 某 一 路 结合 点 上 最 新 的 对 象 ， 此 外 a 被 看 作 另 
路 结合 点 上 最 新 的 对 象 。 其 他 条 目的 使 用 时 间 也 类 似 定义 。 知 道 在 加 入 以 后 的 
“最 坏 ” 情 况 是 什么 吗 ?” 只 有 在 确保 两 个 通路 的 条 目 都 存在 于 缓存 中 时 ， 才 能 保证 
该 条 目 存 在 于 缓存 中 。 这 意味 着 相交 的 内 存 对 象 决 定 了 加 入 “必须 分 析 ” 的 结果 。 
作为 最 坏 情况 的 例子 ， 必 须 让 两 条 通路 都 承担 着 最 长 时 间 的 数据 存在 。 图 5.6 显示 
了 结果 ， 很 明显 ， 该 分 析 必 须 基 于 每 组 缓存 通路 的 条 目 集合 。 

接 下 来 继续 讨论 可 能 的 分 析 控 制 流 接 口 。 图 5. 7 描述 了 这 一 场景 。 
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图 5.7 LRU 缓存 在 程序 结合 点 的 可 能 分 析 


在 两 条 通路 的 某 一 条 加 入 通路 后 ， 缓 存 中 的 数据 有 可 能 被 加 入 。 这 意味 着 对 象 
在 进入 缓存 后 ， 一 组 对 象 的 联合 也 会 被 加 入 到 缓存 中 。 在 最 佳 情况 下 ， 可 以 在 加 入 
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后 使 用 最 少时 间 。 图 5. 7 显示 了 这 个 结果 。 

对 于 内 存 块 b 的 引用 来 说 ， 被 访问 的 内 存 块 移动 至 时 间 最 新 的 位 置 上 ， 此 外 其 
他 的 内 存 块 的 进入 时 间 加 1。 

静态 分 析 还 包括 了 对 流水 线 的 分 析 。 流 水 线 分 析 必须 计算 在 机 器 流水 线 上 执行 
的 机 器 码 循环 次 数 的 边界 。R. Wilhelm [ Wilhelm, 2006] 以 及 S. Thesing [Thesing, 
2004] 对 流水 线 分 析 做 了 细致 的 陈述 。 

静态 分 析 的 总 体 结果 由 每 个 程序 的 基本 块 执行 时 间 的 边界 组 成 。 在 图 5.4 所 示 
的 PER 文件 图 中 写 人 了 结论 。 

aiT 的 下 一 个 阶段 使 用 这 些 边界 是 为 了 获取 整个 程序 的 最 坏 执行 时 间 ， 这 些 步 
BRAG ILP 模型 。 在 这 些 模型 中 ， 总 的 运行 时 间 用 于 目标 函数 中 。 总 的 执行 时 间 的 
计算 通过 对 基础 模块 的 预期 执行 时 间 乘 以 它们 的 执行 频率 得 到 。 基 本 块 的 执行 时 间 
定义 为 这 个 块 的 单 次 执行 WCET (作为 静态 分 析 进 行 计算 ) 乘 以 最 坏 情况 下 执行 
的 块 的 数量 。 只 有 部 分 执行 块 的 数目 可 以 被 自动 确定 。 因 此 ， 确 定 ILP 模型 依赖 于 
额外 的 设计 者 提供 的 信息 ， 例 如 循环 边界 。 这 些 信息 可 以 从 外 部 的 AIP 文件 中 获 
得 。 约 束 块 之 间 的 关系 模型 ， 这 种 对 执行 时 间 进 行 模拟 的 技术 被 称 作 隐 式 路 径 枚 
举 ， 这 种 方法 避免 了 对 大 量 潜在 的 可 执行 路 径 的 执行 。 用 这 种 方法 定义 的 ILP 问题 
可 以 通过 一 些 标准 的 ILP 解决 最 大 化 目标 函数 。 使 用 总 体 执行 时 间 可 以 生成 最 大 的 
生产 效率 的 安全 上 界 。aiT 还 可 以 通过 带 注释 的 控制 流 图 提供 一 个 可 视 化 的 结果 。 
设计 者 可 以 分 析 这 些 图 标 用 来 优化 设计 系统 。 


5.2.3 实时 微 积分 学 


Thiele 的 实时 微 积 分 ( Real-Time Calculus, RTC) 以 对 传人 事件 的 速率 的 描述 作 
为 依据 -。 这 些 描述 中 也 包含 着 对 波动 率 的 描述 。 为 达到 这 样 的 目的 ， 时 间 序 列 事 
件 的 特性 (或 流 ) 可 以 被 表示 为 一 个 元 组 到 达 的 曲线 : 

a" (A), œa (A) eIR=0,AeIR=0 

这 些 曲线 代表 了 最 大 位 移 。 最 小 数量 事件 到 达 的 时 间 间 隔 为 4。 对 于 所 有 的 
20 来 说 ， 在 某 一 时 间 间 隔 中 (t,t +A)， 最 多 有 (A) EHRE, Bbw a! 
(A) 个 事件 发 生 。 图 5.8 显示 了 基于 某 些 可 能 到 达 事 件 的 模型 可 能 到 达 事件 的 
数量 。 

例如 ， 在 以 p 作为 周期 的 周期 事件 流 到 来 的 情况 下 ， 在 此 时 间 间 隔 内 ， 最 多 只 
能 一 个 事件 发 生 〈0，P)”。 同 样 ， 两 个 时 间 的 时 间 间 隔 也 有 一 个 上 界 (p, 2p). 
现在 ， 假 设 时 间 间 隔 的 下 界 (0，P) ， 在 此 时 间 间 隔 内 有 可 能 一 次 事件 都 没有 发 


























O 所 有 有 关 实时 微 积分 学 的 描述 都 是 基于 Zurawski 所 著 书籍 中 Thiele 在 相关 章节 所 作 的 描述 [Thiele， 
2006b ] ， 在 系统 级 所 要 考虑 的 因素 被 称 为 模块 化 的 性 能 分 析 (Modular Performance Analysis, MPA), 
O 不 讨论 A =n*p 不 连续 时 的 情况 。 
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图 5.8 到 达 曲 线 : 周期 性 的 事件 流 (Ze) 和 有 拌 动 /的 周期 性 的 事件 流 ( 右 ) 


生 ， 因 此 边界 为 0。 对 于 时 间 间 隔 (p，2p) ， 必 须 至 少 有 一 个 事件 ， 因 此 边界 为 1。 
所 以 ,对 于 A=0.5p， 最 少 0 个 最 多 1 个 事件 到 来 ( 见 图 5.8 左 图 ) 。 至 于 伴随 着 
抖动 /的 周期 性 事件 流 ， 曲 线 的 周期 随 着 此 量 移动 。 上 界 向 左 移 动 ， 下 界 向 右 移 
动 。 假 定 拌 动 不 会 积累 ， 通 过 在 符号 上 加 入 一 个 上 标 ( 例 如) 表示 所 有 的 事件 。 

可 用 的 计算 以 及 通信 服务 的 功能 可 以 由 一 组 服务 函数 来 描述 : 

B’ (A), B (A) eIR>0, AeIR=0 

这 些 函 数 允 许 人 们 去 模拟 可 用 的 服务 功能 的 波动 情况 。 图 5. 9 显示 了 一 些 时 分 
多 址 (Time Division Multiple Access, TDMA) 总 线 的 通信 功能 。 这 种 功能 会 周期 性 
地 分 配 一 段 时 间 p。 总 线 仲裁 机 制 会 将 时 间 划 分 成 的 时 间 片 分 配给 总 线 。 在 这 段 时 
间 片 中 ， 总 线 会 达到 的 带宽 。 





容量 
f ar 

Cia g 
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s bs py 
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图 5.9 TDMA 总 线 服务 功能 


如 果 总 线 在 进行 观测 时 即 被 分 配 ， 则 上 界 就 可 以 被 准确 获得 ， 转 移 的 数量 将 会 
呈现 线性 的 增长 。 如 果 在 长 度 A 期 间 进 行 观察 时 总 线 被 释放 ， 那 么 就 可 以 获得 对 
应 的 下 界 。 此 后 必须 在 p-s 的 时 间 内 进行 等 待 ， 直 到 总 线 被 再 次 分 配 。 

需要 有 单独 的 方法 能 够 对 a 和 8p 之 间 到 达 的 事件 流 (外部) 进行 模型 的 建立 。 
这 种 计算 并 不 是 RIC 的 一 部 分 。 与 之 相反 ， 边 界 事件 中 形成 的 系统 是 由 微 积分 推 
导 得 出 的 〈 见 下 面 所 述 ) 。 

到 此 为 止 ， 还 没有 每 个 到 达 事 件 的 工作 负载 所 需 的 信息 。 传 人 事件 序列 e 的 工 
作 负 载 由 函数 y”(e)，y (e) eIR>0 所 表达 。 这 个 信息 可 由 每 个 事件 所 需 的 代 
码 执行 时 间 的 边界 导出 。 图 5. 10 显示 了 这 些 函 数 的 相关 示例 。 

该 示例 基于 单个 事件 的 处 理 时 间 在 3 ~4 个 时 间 单 元 内 ， 于 是 单个 事件 的 工作 
负载 就 在 3 ~4 个 时 间 单 元 内 变化 ， 两 个 事件 的 工作 负载 在 6 ~8 个 时 间 单 元 内 变 
化 ， 等 等 。 
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图 5.10 工作 负载 特征 描述 


虚线 所 表示 部 分 与 函数 无 关 ， 它 只 定义 了 一 个 由 整数 代表 的 事件 数量 。 由 此 ， 一 个 
到 来 事件 流 的 工作 负载 量 就 可 以 很 容易 地 被 计算 出 来 。 上 界 和 下 届 的 特征 函数 如 下 ， 
a"(A) =y"(a"(A)) (5.3) 
a (A) =y'(a'(A) ) (5.4) 
应 该 有 足够 的 计算 或 通信 能 力 来 处 理 这 些 工作 负载 。 有 足够 的 计算 能 力 被 处 理 
的 时 间 可 以 计算 为 
B(A) =(y') 1 (p"(A)) (5.5) 
B'(A) =(y") “'(B'(A)) (5.6) 
A (5.5) 以 及 式 (5.6) ETM y 以 及 y' 用 于 转换 可 用 计算 或 通信 能 
力 的 边界 (实时 测量 单位 ) ， 并 由 边界 衡量 能 够 处 理 的 事件 的 数量 。 
基于 这 些 信息 ， 可 以 由 到 来 的 事件 流 中 获得 即将 流出 的 事件 流 的 属性 。 假 设 到 
来 的 事件 流 的 特征 是 边界 [ww ，a*] ， 可 以 依照 相应 的 边界 [a ，z ] 计算 流出 的 
事件 流 的 特征 以 及 剩余 的 服务 能 力 ， 以 供 其 他 任务 使 用 。 剩 余 的 服务 能 力 可 以 由 服 
务 曲 线 [B', BY] 至 服务 曲线 [B , B] ( 见 图 5.11) 得 出 。 这 些 剩余 的 服务 能 力 
可 以 用 于 统一 处 理 器 上 的 较 低 优先 级 的 任务 。 








图 5. 11 可 用 于 实时 组 件 的 事件 流 的 转换 以 及 服务 能 力 
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Thiele 等 人 提 到 ， 流 出 的 事件 流 以 及 剩余 的 服务 能 力 受 如 下 函数 约束 [Thiele， 
2006b ] : 





a” =[ (a @B")OB'] AB" (5.7) 

a’ =[(a') Of") @B'] AB (5.8) 

B“ =(p" -a )0 (5.9) 

B =(B' -a") 80 (5. 10) 

式 中 “人 一 一 最 小 运算 符 。 
用 于 这 些 方程 式 的 操作 符 定义 如 下 : 

(f®g) (t) =n f(t -u) +e(u) | (5.11) 

(fg) (t) =supycyer {f(t -u) +g(u) | (5. 12) 

(fg) (t) =sup,so {f(t +u) -g(u) } (3. 13) 

(f@g) (t) =infso (fli +u) -g(u) | (5. 14) 


本 质 上 ， 这 些 等 式 表 达 了 流出 的 事件 流 以 及 系统 服务 能 力 。 这 些 方程 已 被 通信 
理论 所 采用 ， 并 由 网 络 微 积分 所 证 明 [Le Boudec and Thiran，2001]。 可 以 通过 下 
载 Matlab 的 工具 箱 ， 轻 松 使 用 这 些 方程 [ Wandeler and Thiele，2006 ] 。 

同样 的 理论 同样 可 以 计算 出 实时 组 件 所 造成 的 延 时 ， 同 时 还 可 以 计算 出 流入 / 
流出 事件 暂 存 所 需 的 缓冲 区 大 小 。 通 过 这 种 方式 ， 系 统 的 其 他 特征 就 可 以 通过 这 些 
组 件 的 信息 计算 出 来 。 

第 二 个 性 能 分 析 方 法 是 由 Henia, Ernst 等 人 提出 的 。 这 种 方法 被 称 作 Sym- 
TA/S 方法 [ Henia et al. ，2005 ] Thiele 的 方法 中 的 不 同 曲 线 由 标准 的 事件 流 模 
型 ， 比 如 周期 性 的 事件 流 所 取代 。 周 期 性 的 事件 流 伴随 着 拌 动 并 且 周 期 性 的 流 也 
伴随 着 爆发 。SymTA/S 方 法 明确 地 支持 组 合 以 及 集成 不 同类 型 的 分 析 技 术 用 于 
实时 研究 。 


5.3 资源 与 功 耗 模型 


对 于 相应 的 系统 来 说 ， 资 源 模型 以 及 功 耗 模型 的 评估 是 必 不 可 少 的 。 这 两 个 模 
型 有 着 紧密 的 联系 ， 可 以 从 式 (3.13) 中 见 到 。 这 些 模型 旨 在 通过 优化 后 ， 降 低 
系统 的 资源 与 功 耗 的 损耗 。 这 些 方法 也 试图 优化 系统 的 温度 ， 以 实现 功 耗 的 降低 。 

第 一 个 功 耗 模型 是 由 Tiwari [Tiwari et al. , 1994] 提出 的 ， 这 个 方法 基于 观测 
一 个 真正 的 系统 。 测 量 值 与 执行 的 指令 相互 关联 ， 该 模型 内 包含 了 被 称 作 基 础 损耗 
和 内 部 指令 损耗 的 概念 。 每 个 指令 的 基础 损耗 与 每 条 指令 执行 时 消耗 的 功 耗 相 对 
应 ， 它 假设 一 个 有 无 穷 多 个 该 指令 的 序列 被 执行 。 内 部 指令 损耗 模型 模拟 了 处 理 融 
发 生 指 令 变换 时 额外 的 功 耗 消耗 ， 这 些 额 外 的 功 耗损 耗 是 必需 的 。 例 如 ， 切 换 功 能 
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单元 的 打开 和 关闭 。 这 种 功 耗 模型 只 关注 处 理 器 的 消耗 ， 并 不 关心 内 存 或 者 系统 其 
他 部 分 的 功 耗 。 

另 一 种 功 耗 模型 是 由 Simunic 等 人 提出 的 【Simunic et al. ，1999 ] ， 这 种 模型 是 
基于 数据 表 的 模型 。 这 种 方法 的 优势 是 可 以 使 得 谍 入 式 系统 的 所 有 组 件 的 功 耗 都 可 
以 计算 。 但 是 ， 数 据 表 中 的 有 关 平 均值 的 信息 相 较 于 最 大 值 或 最 小 值 的 信息 来 说 ， 
有 可 能 显得 不 是 特别 准确 。 

第 三 种 模型 是 由 Rusell 和 Jacome [| Rusell and Jacome, 1998] 提出 的 ， 这 种 模 
型 基于 对 两 个 固定 的 配置 进行 精准 测量 。 

另外 还 有 一 种 模型 是 由 Lee [Lee et al. , 2001] 提出 的 ， 这 种 模型 包括 了 一 种 
对 流水 线 影响 的 详细 分 析 。 但 这 种 模型 没有 包括 多 周期 操作 以 及 流水 线 停滞 。 

Steinke 等 人 [Steinke et al. , 2001] 提出 了 一 种 基于 实际 硬件 的 精准 测量 方 
法 ,处理 器 的 损耗 以 及 内 存 的 损耗 都 被 包括 在 内 。 这 种 模型 被 集成 进 了 一 种 考虑 实 
际 能 耗 的 编译 器 ence 中 ， 该 编译 器 由 TU Dortmund 公司 研发 。 

通过 CACTI [Wilton and Jouppi, 1996 ] 可 以 对 缓存 的 功 耗 进行 计算 。 

Wattch 功 耗 统计 工具 [Brooks et al. , 2000] 可 以 在 微 处 理 器 系统 的 架构 级 别 
估算 功 耗 ， 而 不 需要 获取 电路 设计 级 别 的 相关 信息 。 

一 些 商 业 工 具 也 提供 了 功 耗 统计 工具 。 

功 耗 估算 适用 于 功 耗 管理 算法 。 

这 些 示例 可 以 得 出 如 下 的 结论 : 对 于 真实 存在 的 硬件 系统 来 说 ， 可 以 生成 一 个 精确 
的 功 耗 模型 。 然 而 在 设计 阶段 ， 由 于 硬件 部 分 的 缺失 ， 功 耗 模型 有 可 能 会 不 太 准 确 9 。 























5.4 热 模型 


嵌入 式 系统 为 了 获取 更 高 的 性 能 ， 往 往 会 使 得 系统 的 各 个 模块 在 运行 时 的 温度 
逢 高。 投入 式 系统 中 各 个 模块 温度 的 升 高 ， 将 严重 影响 系统 的 可 用 性 。 在 最 糟糕 的 
情况 下， 过 热 的 组 件 甚至 会 导致 其 他 系统 的 损坏 。 例 如 ， 过 热 的 系统 有 可 能 导致 火 
灾 的 产生 。 过 热 的 系统 组 件 当然 也 会 导致 调和 人 式 系统 自我 损毁 。 然 而 即使 不 会 对 系 
统 产 生 直接 的 伤害 ， 过 热 的 部 件 也 会 对 系统 产生 其 他 影响 。 例 如 ， 系 统 过 热 会 多 对 
系统 寿命 的 降低 产生 较 大 的 影响 。 

嵌入 式 系统 的 热效应 与 系统 的 电 一 热能 转化 有 着 紧密 的 联系 ， 因 此 热 模 型 通常 
与 能 量 模 型 紧密 相连 。 热 模型 基于 物理 原则 ， 首 先 要 考虑 热传导 。 热 传导 反映 了 一 
块 板子 〈 由 某 种 材料 制 成 ) ， 该 板子 的 面积 为 4 并 且 厚 度 为 L。 热 传导 表明 了 基于 
IK 的 变化 时 ， 所 传递 的 热能 量 的 数量 。 热 导 率 的 倒数 被 称 作 热 阻 。 对 于 多 块 板子 
来 说 ， 总 的 有 效 热 阻 的 值 是 每 一 块 板子 的 热 阻 的 和 。 














O 在 讨论 中 ， 有 时 会 有 大 概 50% 的 偏差 。 
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这 意味 着 热 阻 递 加 的 方式 有 些 类 似 于 电路 中 电阻 的 至 加 。 对 于 热能 的 贮藏 也 与 
电路 中 电容 储 电 的 方式 类 似 。 所 以 ， 热 模型 通常 等 价 于 电路 模型 ， 并 且 可 以 使 用 非 
常 成熟 的 、 用 于 解决 电路 网 络 的 方程 式 (参见 例如 Chen 等 人 的 研究 [Chen et al. , 
2010])。 

热 模 型 的 工具 包括 HotSpot [Skadron et al. ，2009] ， 该 工具 可 以 整合 功 耗 模型 ， 
例如 Wattch。 这 两 种 工具 的 集合 可 以 与 SimpleScalar 的 功能 相提并论 [ Simple Scalar 
LLC, 2004] 。 热 模 型 的 验证 需要 精准 的 温度 测量 [ Mesa-Martinez et al. , 2010 | 。 


5.5 风险 及 可 靠 性 分 析 


嵌入 式 及 物理 子 系统 〈 如 同 其 他 的 产品 一 样 ) 会 对 人 们 的 生活 造成 损害 。 把 
发 生 和 危害 的 风险 降低 到 0 是 不 可 能 的 ， 所 以 能 做 的 就 是 尽 可 能 将 损害 的 严重 程度 降 
低 ， 并 希望 发 生 该 风险 的 数量 级 小 于 其 他 类 型 的 风险 。 如 今 要 讨论 的 任务 将 在 未 来 
变 得 更 加 困难 ， 因 为 随 着 单位 面积 二 极 管 数量 的 增加 ， 二 极 管 设备 的 可 靠 性 也 将 随 
之 降低 [ITRS Organization，2009 ] 。 暂 态 以 及 永久 性 的 故障 将 会 变 得 越 来 越 频繁 . 
随 着 PCB 板 卡 面积 的 减 小 ， 也 会 增加 设备 参数 的 不 确定 性 。 因 此 ， 可 靠 性 分 析 以 
及 元 余 设 计 将 会 变 得 极其 重要 [ Mukherjee, 2008], [Garg and Khatri, 2009] , Z 
极 管内 部 的 损坏 也 许 会 导致 整个 系统 的 崩溃 。 这 些 错 误 类 型 、 故 障 的 相关 术语 以 及 
服务 是 由 Laprie 等 人 定义 的 【Laprie，1992] [Avižienis et al. , 2004], 
定义 : 

1) “由 系统 提交 的 服务 (角色 作为 服务 提供 者 ) 的 行为 应 该 能 够 被 用 户 所 感 
知 ; 递交 的 服务 是 服务 提供 者 外 部 状态 的 序列 ， 当 服务 实现 了 系统 功能 ， 该 服务 就 
可 被 认 作 正确 的 服务 被 系统 提交 ”。 

2) “一 个 有 故障 的 服务 ， 此 处 缩写 为 故障 ， 表 明 一 个 系统 提供 的 服务 发 生 了 
某 种 事件 ， 导 致 该 服务 偏离 正确 的 服务 。 一 个 有 故障 的 服务 就 是 从 正确 的 服务 到 不 
正确 的 服务 的 转变 过 程 。” 

3) 如 果 系统 中 某 个 状态 不 正确 ， 将 导致 错误 一 直 存在 ， 并 且 有 可 能 导致 其 随 
后 的 服务 发 生 故障 。 

4) “如果 某 个 错误 是 由 判定 或 假设 所 导致 的 ， 则 称 之 为 故障 。 故 障 有 可 能 来 
自 内 部 或 外 部 的 系统 。” 

有 些 故 障 并 不 会 导致 系统 的 崩 演 。 

例如 ， 可 以 假设 某 个 瞬时 故障 导致 了 内 存 比特 位 的 反 转 。 当 比特 位 翻转 后 ， 内 
存单 元 记录 的 信息 将 会 发 生 错误 。 当 系统 服务 被 该 错误 比特 位 影响 时 ， 将 会 产生 
故障 。 

为 了 与 这 些 定义 一 致 ， 将 考虑 系统 在 不 提供 所 有 这 些 系统 功能 的 情况 下 ， 讨 论 
故障 率 问 题 。 将 在 无 论 假定 是 否 是 潜在 的 原因 导致 系统 故障 的 前 提 下 ， 讨 论 故 障 。 
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有 无 数 种 原因 会 导致 系统 故障 的 产生 ， 有 些 故 障 产 生 的 原因 是 二 极 管 体积 的 减 小 。 
本 书 将 不 会 提 及 有 关 错 误 的 处 理 过 程 。 
对 许多 应 用 程序 来 说 ， 发 生 程序 崩溃 的 概率 必须 小 于 10-"/h [Kopetz, 1997], 
这 也 与 每 10 万 个 系统 运行 1 万 上 的 场景 相对 应 。 达 到 这 种 程度 的 可 靠 性 惟一 可 行 
的 方法 就 是 在 设计 评估 阶段 进行 系统 的 可 靠 性 分 析 ， 以 达到 预期 的 运行 时 间 和 相关 
目标 。 这 种 分 析 通 常 基 于 系统 发 生 故障 的 概率 。 
更 准确 地 说 ， 要 考虑 系统 发 生 故 障 的 概率 密度 。 假 定 * 是 第 一 次 发 生 故 障 的 时 
E, x 是 一 个 随机 的 变量 ， 则 假定 f(x) 是 这 个 随机 变量 的 概率 密度 。 
作为 一 个 示例 ， 通 常 使 用 指数 概率 密度 f(x) = Ae-*“。 对 于 该 密度 函数 来 说 ， 
系统 的 故障 有 可 能 随 着 时 间 的 流动 而 降低 〈 在 未 来 的 某 段 时 间 ， 系 统 有 可 能 就 停 
止 工作 ， 而 一 个 停止 工作 的 系统 是 无 法 导致 错误 产生 的 ) 。 这 种 密度 函数 使 用 得 非 
常 频繁 ， 因 为 这 种 密度 函数 不 但 有 着 良好 的 数学 性 质 ， 另 外 在 系统 实际 运行 时 的 故 
障 率 往往 是 未 知 的 。 当 缺少 系统 故障 率 时 ， 会 假定 一 个 比率 ， 以 用 于 指数 密度 函 
数 。 指 数 分 布 有 可 能 是 不 准确 的 ， 但 是 它 假定 了 一 个 典型 的 至 少 是 粗略 近似 于 真实 
系统 的 系统 。 图 5. 12 左 图 展示 了 这 个 密度 函数 。 
Ax) F(t) 
À 


N 


0 ne wim 0 á 








图 5. 12 指数 分 布 的 密度 函数 和 概率 分 布 


概率 分 布 通常 来 说 会 比 密度 更 有 趣 。 这 个 分 布 表 明 系 统 在 1 时刻 不 工作 的 概 
率 。 该 分 布 可 以 通过 对 密度 函数 到 1 时刻 的 积分 获得 : 


F(t) =Pr(x<t) (5. 15) 
F(t) = [se ax (5. 16) 

例如 ， 通 过 指数 分 布 可 以 获得 : 
F(t) = | Aedes [esl 1-0 (5.17) 


图 5. 12 右 图 包含 了 类 似 的 函数 。 随 着 时 间 的 推移 ， 该 概率 有 可 能 达到 1， 这 
意味 着 随 着 时 间 的 前 进 ， 系 统 的 故障 概率 将 是 必然 事件 。 
定义 : 系统 的 可 靠 性 R(:) 是 指 系统 第 一 次 发 生 故 陪 的 概率 大 于 1 时刻. 
R(t) =Pr(x >t) ,t=0 (5. 18) 


R(t) = [ fx) a (5. 19) 
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F(t) #R(1) = [fla)de + 人 aa =1 (5.20) 
R(t) =1-F(t) (5.21) 
Ka) -PW (5.22) 
对 于 指数 分 布 ， 有 R(t) =e" (WA 5.13), 


Rit) 
1N 





1/4 t 


图 5. 13 指数 分 布 的 可 靠 性 


系统 在 1=1/A 时 刻 发 生 故 障 的 概率 大 约 是 37% 。 
定义 : 故障 率 人 (1) 是 系统 在 1 时刻 以 及 i+At 时 刻 的 系统 发 生 故 障 的 概率 ; 
Pr(t<x<t+Atlx >t) 
At 


Pr(t<ax<t+Atl x >t) 是 系统 在 1 时 刻 时 间 间 隔 上 的 系统 崩溃 的 条 件 概率 。 
对 于 条 件 概率 ， 有 一 通用 的 等 式 Pr(41B) = Pr(AB)/Pr(B) ,Pr(4B) 是 4 与 B 发 生 
的 概率 。 在 本 例 中 ，Pr(4B) 等 于 F(i+At) -F()。Pr(B) 是 系统 在 上 时 刻 依旧 工 
作 的 概率 ，R(t) 作为 表示 该 概率 的 符号 。 因 此 ， 式 (5.23) 可 以 得 出 : 
F(t+At)-F(t) _ f(t) 





A(t) = lim (5.23) 








A(t) =i AtR(t) ~ R(t) (3:24) 
例如 ， 获 得 的 指数 分 布 ? : 
fo t 
A(t) = R(t) = (5.25) 
故障 率 经 常 被 观测 为 LF IT 的 倍数 Casha), “FIT” 代 表 故 障 发 生 的 时 刻 。 
1FIT 对 应 于 每 10° 发 生 一 次 故障 。 A(t) 


然而 ， 真 正 的 系统 故障 率 通常 是 不 断 
变化 的 ， 对 大 多 数 系 统 来 说 ， 都 有 一 个 
“WiL (Bath Tub)” 行 为 ( 见 图 5.14)。 EN ! 
MPRA, TUR, ERAH e BOE ， 第 三 阶段 
初始 阶段 的 故障 率 相 对 更 高 。 导 致 高 的 故 
障 率 的 原因 是 不 完美 的 生产 工艺 或 “早期 图 5.14 Yorn 








”该 结论 促使 使 用 同样 的 符号 表示 故障 率 以 及 恒定 指数 分 布 。 
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故障 期 "。 在 其 能 够 正常 工作 时 ， 其 故障 率 就 变 得 比较 恒定 。 在 产品 的 最 终 阶 段 ， 由 
于 磨损 导致 系统 故障 率 又 开始 变 高 。 
定义 : 故障 的 平均 时 间 ( Mean Time To Failure, MTTF) 是 从 系统 初始 工作 起 ， 直 到 
下 次 发 生 故障 时 的 运行 平均 时 间 。 该 平均 时 间 可 以 由 一 个 随机 变量 * 代表 的 期 望 值 
计算 得 出 : 

MTTF = E}{ x} =Í xf( x) dx (5.26) 


该 积分 可 以 通过 乘积 法 则 计算 得 出 〈 | w' =w - fuv, 在 本 例 中 , 有 =x 
以 及 ”= Ae“)。 因 此 ， 由 式 (5.27) 可 以 得 出 : 
MTTF = len wl e “dx (5. 28) 
(5. 29) 
这 意味 着 ， 对 于 指数 分 布 来 说 ， 直 到 下 次 系统 故障 时 的 预期 执行 时 间 是 故障 率 
的 倒数 。 
定义 : 平均 修复 时 间 (Mean Time To Repair，MTTR) 是 假若 系统 不 工作 ， 修 复 系 
统 的 平均 时 间 。 该 时 间 是 用 随机 变量 的 期 望 值 代表 系统 的 修复 时 间 。 
定义 : 平均 故障 间隔 时 间 ( Mean Time Between Failures, MTBF) 是 每 两 次 故障 之 间 
的 平均 时 间 。 
平均 故障 间隔 时 间 是 平均 无 故障 时 间 及 平均 故障 修复 时 间 之 间 的 和 ; 
MTBF = MTTF + MTTR (5. 30) 
图 5. 15 显示 了 关于 该 等 式 的 简单 示例 图 ， 该 图 并 不 仅仅 反映 了 处 理 概 率 事件 的 方 
法 ， 而 且 显示 了 实际 的 平均 故障 间隔 时 间 、 平 均 无 故障 时 间 以 及 平均 故障 修复 时 间 
的 值 的 变化 随机 性 。 


上 
oa Le l = = js 


MTTR 


La! 


可 用 | 

不 可 用 [| 
| 

< MTTF —»a—— MTBF ——», 

—<——- MTBF 一 一 | 

















> 
t 








图 5.15 图 解 MTTF、MTTR 以 及 MTBF 


对 大 多 数 系统 来 说 ， 并 不 考虑 系统 修复 的 相关 事宜 。 此 外 ， 假 如 考虑 系统 修 
Z, 那么 MTTR 应 明显 小 于 MTTF。 因 此 ，MTBF 与 MTTF 经 常会 混淆 不 清 。 例 如 ， 
硬盘 的 使 用 寿命 可 以 引用 MTBF ， 尽 管 该 硬盘 也 许 永远 不 会 被 修复 。 但 引用 了 该 参 
数 ， 则 MTTF 的 时 间 将 会 变 得 更 加 准确 。 不 过 ，MTTF 仅仅 为 可 靠 性 提供 了 非常 粗 
糙 的 信息 ， 特 别 是 随 着 时 间 的 变化 ， 故 障 率 也 会 有 很 大 的 变化 。 
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定义 : 可 用 性 是 系统 处 于 可 运行 状态 的 概率 。 

系统 的 可 用 性 也 随 着 时 间 变化 (参考 浴 生 曲线 ) 。 因 此 ， 可 以 通过 一 个 时 间 依 
AURAL A(t) 模拟 可 用 性 。 然 而 ， 时 间 间 隔 较 大 时 ， 更 多 的 是 只 考虑 可 用 性 A, A 
It, EX: 

f MTTF 
A =limA (1) = MTBF (5.31) 
例如 ， 假 定 有 一 个 能 够 运行 999 天 ， 另 外 需要 1 天 进行 修复 的 系统 ， 那 么 该 系统 的 
可 用 性 4 =0. 999, 

可 以 允许 的 故障 率 大 约 是 1FIT。 这 可 能 是 比 芯片 的 故障 率 还 要 低 若 干 数量 级 
的 值 。 这 意味 着 系统 必须 要 比 它 的 组 成 部 分 更 加 可 靠 ! 明显 地 ， 所 需 的 可 靠 性 的 级 
别 意 味 着 就 必须 有 对 应 的 容错 技术 。 

获取 实际 的 故障 率 是 非常 困难 的 。 图 5. 16 显示 了 为 数 不 多 的 公布 的 实际 故障 
率 [TriQuint Semiconductor Inc. , 2010], 

图 5. 16 BA FATALE (GaAs) 设备 的 二 极 管 在 ISOC 的 情况 下 ， 运 行 
时 的 故障 率 。 本 例 用 于 说 明 ， 无 论 是 假设 的 恒定 故障 率 还 是 浴缸 行为 都 是 过 于 简单 
的 。 因 此 ， 仅 仅 引 用 一 个 MTTF 数据 有 可 能 会 产生 一 定 的 误导 。 
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图 $. 16 TriQuint GaAs 设备 故障 率 (由 TriQuint, Inc. , Hillsboro 提供 ，@ TriQuint ) 











实际 的 故障 分 布 随 着 时 间 的 流逝 而 被 替换 。 在 作为 特例 的 本 例 中 ， 尽 管 产 品 运 
行 于 高 温 中 ， 但 在 产品 生命 周期 的 最 初 20 年 中 (175300h) ， 故 障 率 低 于 100 FIT, 
FIT 的 值 实际 上 非常 依赖 于 温度 ， 当 温度 大 于 275C, Triquin 计算 出 系统 处 于 失 
败 率 的 时 间 已 经 远 远大 于 系统 可 用 的 时 间 。Triquint 声称 ， 他 们 的 GaAs 设备 相 较 于 
其 他 半导体 设备 来 说 ， 拥 有 更 高 的 可 靠 性 。 关 于 FIT 的 测试 报告 也 可 用 于 Xilinx 
FPGA 中 (参见 [Xilinx，2009] ) 。 

对 一 个 完整 的 系统 来 说 ， 用 实验 的 方法 去 验证 故障 率 通常 是 不 可 能 的 。 不 能 使 
用 实验 的 方法 的 原因 是 故障 率 太 低 并 且 故 障 导致 的 结果 有 时 无 法 接受 。 不 能 驾驶 
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10° 架 飞 机 飞行 104h， 已 验证 是 否 已 经 让 系统 的 故障 率 低 于 10 ?1 解决 这 种 两 难 境 
地 的 惟一 出 路 是 检查 组 件 的 故障 率 ， 从 而 和 使 用 相 结 合 ， 由 此 推导 出 整个 系统 的 可 
靠 性 。 设 计 和 用 户 生成 的 故障 也 必须 予以 考虑 。 使 用 决策 图 来 计算 系统 的 组 件 可 靠 
性 ， 也 是 一 种 艺术 [Israr and Huss, 2008 | 。 

系统 的 损坏 是 由 潜在 的 危害 导致 的 (系统 故障 的 原因 之 一 ) 。 对 于 每 一 个 可 能 
的 损坏 引起 的 系统 故障 ， 有 严重 性 (成 本 ) 和 可 能 性 之 说 。 风 险 也 可 以 被 定义 为 
两 个 产品 。 关 于 组 件 故 障 导致 的 损坏 ， 也 可 以 得 出 有 两 种 对 应 的 技术 [ Dunn, 
2002], [ Press, 2003]: 

1) 故障 树 分 析 法 ( Fault Tree Analysis, FTA); FTA 是 一 个 自 顶 向 下 的 风险 分 
析 方 法 。 该 分 析 方 法 始 于 一 有 可 能 的 危害 ， 并 尝试 提出 会 导致 出 现 该 危害 的 可 能 饼 
场景 。FTA 基于 布尔 函数 的 模型 ， 并 反映 系统 操作 的 状态 (工作 或 不 工作 ) 。FTA 
特别 包括 了 与 以 及 或 符号 ， 用 于 代表 有 可 能 出 现 危害 的 状态 。 或 门 用 于 只 要 有 任意 
一 个 系统 风险 ， 就 会 导致 系统 损害 。 与 门 用 于 表示 当 有 若干 个 系统 风险 同时 存在 
时 ， 方 可 导致 系统 损害 。 图 5. 17 展示 了 一 个 示例 3。FTA 是 一 个 基于 系统 的 结构 
模型 ， 即 它 反映 了 系统 组 件 的 划分 。 
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图 5.17 故障 树 


简单 的 与 门 以 及 或 门 都 不 能 模拟 所 有 的 场景 。 例 如 ， 如 果 有 共享 资源 或 者 是 一 
些 受 限 的 量 存在 〈 例 如 可 用 功 耗 或 者 存储 空间 ) ， 那 么 就 将 超出 其 建 模 能 力 。 
Markov 模型 [Bremaud, 1999] 或 许可 以 用 来 处 理 这 些 场景 。Markov 模型 基于 状态 
的 概念 ， 而 非 系统 的 结构 。 

2) 故障 模式 与 影响 分 析 ( Failure Mode and Effect Analysis, FMEA): FMEA 由 
组 件 开始 进行 分 析 ， 并 尝试 去 估算 其 可 靠 性 。 利 用 这 些 信息 ， 就 可 以 通过 对 各 个 组 
件 的 可 靠 性 进行 计算 来 获取 系统 的 可 靠 性 〈 这 与 自 底 向 上 的 分 析 方 法 相对 应 ) 。 首 
先 ， 要 创建 一 个 包含 各 个 组 件 的 表 ， 表 中 包含 可 能 出 现 的 故障 、 故 障 的 概率 以 及 接 
下 来 的 系统 行为 。 总 的 来 说 ， 系 统 风险 都 可 以 通过 这 张 表 进行 计算 。 图 5. 18 显示 





〇 ”为 了 与 ANSIIEEE 91 标准 相 一 致 ， 使 用 符号 人 ，=1 以 及 >1 来 代表 与 、 异 或 以 及 或 门 。 
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了 对 应 的 示例 。 


| 组 件 











处 理 器 





图 5.18 FMEA 表 


通过 工具 的 支持 ， 这 两 种 方法 都 是 可 以 使 用 的 。 这 两 种 方法 也 都 可 以 在 “ 安 
全 情况 下 ”使 用 。 在 这 种 情况 下 ， 必 须要 有 一 个 独立 的 机 构 以 确保 某 些 技术 设备 
是 确实 安全 的 。 对 技术 系统 的 通常 要 求 是 ， 没 有 任何 一 个 单独 的 组 件 可 以 导致 一 场 
灾难 。 

对 于 安全 的 要 求 ， 不 应 该 仅仅 做 到 亡羊补牢 ， 而 是 要 保证 整个 系统 从 一 开始 就 
是 正确 的 。 每 一 个 系统 的 设计 主题 都 应 该 是 安全 且 可 靠 的 ， 本 书 也 只 能 提供 一 些 有 
关 这 些 方向 的 线索 。 

据 Kopetz [ Kopetz, 2003] 所 述 ， 下 列 事宜 应 被 考虑 : 对 于 安全 性 要 求 极度 苛 
刻 的 系统 来 说 ， 系 统 的 整体 必须 比 其 某 一 部 分 更 加 可 靠 。 该 系统 最 多 只 人 允许 平均 每 
10°h 出 现 一 次 故障 。 这 个 数据 比 芯片 发 生 故 障 的 几率 要 小 1/1000。 因 此 ， 容 错 机 
制 的 使 用 是 必需 的 。 由 于 系统 的 故障 率 非 常 低 ， 所 以 整个 系统 有 可 能 没有 经 过 
100% 的 验证 。 但 是 ， 系 统 的 安全 性 必须 通过 测试 和 推理 相 结合 进行 验证 ， 所 以 必 
须 使 用 抽象 的 方法 来 解释 系统 分 层 的 行为 模型 ， 设 计 的 失误 以 及 人 为 造成 的 故障 也 
必须 考虑 在 内 。 为 了 解决 这 些 问 题 的 挑战 ，Kopetz 提出 了 如 下 12 个 设计 原则 : 

1) 系统 的 安全 性 应 该 作为 系统 规格 说 明 书 的 重要 部 分 ， 用 来 推动 系统 的 整体 





设计 o 
2) 假定 设计 规格 在 系统 的 初始 设计 时 就 必须 非常 精准 ， 规 格 中 包括 预期 的 故 
障 概率 。 


3) 故障 控制 范围 ( Fault Containment Regions, FCR) 必须 被 考虑 进去 ， 在 一 
个 FCR 中 发 生 的 故障 不 应 该 影响 到 其 他 FCR, 

4) 从 一 开始 就 应 该 建立 一 个 统一 的 时 区 ， 否 则 系统 无 法 辨识 初始 的 及 之 后 的 
错误 。 

S) 定义 良好 的 接口 必须 能 够 隐藏 内 部 的 组 件 。 

6) 必须 确保 每 个 组 件 的 故障 不 会 影响 到 其 他 组 件 。 

7) 组 件 应 该 认为 自己 是 正确 的 ， 除 非 两 个 或 两 个 以 上 的 其 他 组 件 与 该 组 件 的 
预期 结果 相反 (自信 原则 ) 。 

8) 容错 机 制 必须 设计 为 在 解释 系统 的 行为 时 ， 不 会 对 系统 造成 额外 的 负担 。 
容错 机 制 不 应 该 与 常规 函数 挂钩 。 

9) 系统 的 设计 必须 经 过 诊断 。 例 如 ， 它 必须 能 够 鉴别 出 现存 在 的 (但 尚未 发 
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现 的 ) 错误 。 

10) 人 机 界面 必须 直观 大 方 。 即 使 用 户 的 使 用 有 错误 ， 也 必须 保证 系统 的 
安全 。 

11) 应 记录 每 一 个 异常 。 有 些 异 常 可 能 无 法 在 常规 的 接口 中 观测 到 。 该 记录 
必须 涉及 内 部 的 影响 ， 否 则 的 话 ， 这 些 异 常 有 可 能 被 系统 的 容错 机 制 所 掩饰 。 

12) 提供 一 个 永 不 放弃 的 策略 。 舱 人 式 系统 有 可 能 提供 不 间断 的 服务 。 弹 出 
的 窗口 以 及 系统 的 脱 线 是 不 可 能 被 接受 的 。 

如 果 需 要 有 关系 统 可 靠 性 及 安全 性 的 更 多 信息 ， 请 参考 书籍 [Laprie, 1992], 
[ Neumann, 1995], [ Leveson, 1995], [Storey, 1996], [ Geffroy and Motet, 2002] 
以 及 相关 领域 。 

最 近 有 着 大 量 的 关于 系统 可 靠 性 设计 类 的 出 版 物 ， 例如 Huang [ Huang and 
Xu, 2010], Zhuo [Zhuo et al. ，2010] ， 以 及 Pan [ Pan et al. , 2010], 


5.6 仿真 


仿真 是 一 种 非常 普遍 的 评估 以 及 设计 验证 技术 。 仿 真一 般 是 在 适合 的 计算 机 硬 
件 上 执行 设计 模型 ， 特 别 是 在 通用 数字 计算 机 上 。 很 明显 ， 这 需要 模型 能 够 被 执 
行 。 在 第 2 章 介绍 了 所 有 用 于 执行 的 建 模 语言 ， 这 些 语言 可 用 于 的 级 别 和 范围 在 
2.9 市 做 了 相应 说 明 。 在 哪个 级 别 进行 仿真 设计 经 常 要 在 速度 和 精度 之 间 进 行 受 
协 。 仿 真 速度 越 快 ， 那么 精度 就 越 低 。 

到 现在 为 止 , 使 用 了 术语 意义 上 的 系统 功能 行为 (输入 /输出 行为 )。 也 有 一 
些 非 功 能 性 的 设计 行为 ， 包 括 热 行为 以 及 与 其 他 电子 设备 之 间 的 电磁 兼容 (EMC) 
等 。 由 于 与 物理 学 的 结合 ， 可 能 有 大 量 的 物理 效应 需要 包含 在 仿真 模型 内 。 因 此 ， 
本 书 不 可 能 涵盖 所 有 的 物理 子 系统 相关 的 仿真 方法 。Law [Law, 2006] 提供 了 有 
关 数 字 系统 的 模拟 及 仿真 的 方法 综述 。 

对 于 物理 子 系统 来 说 ， 仿 真有 着 严重 的 限制 

1) 仿真 通常 要 比 实际 的 设计 慢 很 多 。 因 此 ， 如 果 将 仿真 结果 与 实际 环境 相对 
应 ， 可 能 会 有 相当 多 的 数值 违反 时 间 约 束 。 

2) 模拟 物理 环境 甚至 有 可 能 导致 危险 的 产生 ( 谁 想 驾驶 一 辆 有 着 不 稳定 控制 
软件 的 车 呢 ?)。 

3) 对 于 许多 应 用 来 说 ， 其 内 部 可 能 需要 海量 的 数据 ， 这 可 能 导致 仿真 系统 其 
在 可 用 的 时 间 内 无 法 模拟 足够 的 数据 。 多 媒体 应 用 就 是 其 中 的 一 种 ， 例 如 模拟 视频 
流 的 压缩 ， 就 需要 大 量 的 时 间 。 

4) 实际 的 系统 往往 太 复杂 ， 以 至 于 仿真 系统 无 法 运行 所 有 的 用 例 (输入 )。 
因此 ， 可 以 使 用 仿真 系统 来 帮助 人 们 发 现 设计 错误 。 仿 真 系统 无 法 保证 系统 没有 错 
误 ， 因 为 仿真 系统 无 法 保证 去 进行 所 有 的 系统 内 部 状态 及 输入 的 可 能 组 合 。 
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由 于 这 些 限制 ， 就 要 更 加 注重 正式 的 核查 以 及 验证 。 然 而 ， 先 进 的 仿真 技术 也 
将 继续 发 挥 其 关键 作用 (例如 ，Braun et al. [ Braunet al. , 2010 ] ) 。 


5.7 快速 原型 及 仿真 


基于 模型 的 仿真 ， 更 加 贴近 于 真实 系统 。 通 常 来 说 ， 真 实 的 系统 和 模型 之 间 会 
有 一 些 差异 ， 可 以 通过 实现 某 些 部 分 的 SUD， 使 得 仿真 结果 更 加 精确 (例如 ， 在 
一 个 实际 的 物理 组 件 中 ) 。 
定义 : 采用 M Gregor [M'Gregor, 2002] 的 定义 ， 定 义 仿真 作为 执行 SUD 模型 的 
过 程 中 ， 至 少 有 一 个 组 件 不 在 某 种 主机 上 进行 仿真 。 

据 M Gregor 所 说 ,“ 人 们 对 仿真 越 来 越 感 兴趣 的 原因 不 仅仅 是 弥合 系统 和 模型 
之 间 的 差距 一 一 上 述 的 有 关 仿 真 模型 的 定义 ， 即 使 倒转 过 来 也 依然 有 效 一 一 仿真 模 
型 是 一 个 真实 系统 的 某 一 部 分 被 模型 所 取代 。” 在 真实 系统 下 使 用 仿真 模型 测试 控 
制 系统 ， 通 过 替换 … (真实 系统 ) … 为 一 个 模型 ， 对 那些 需要 调试 的 人 或 需要 自 
动 化 安装 及 启动 的 系统 来 说 ， 具 有 相当 大 的 兴 

为 了 进一步 提高 可 信 性 ， 可 以 进一步 通过 真实 的 组 件 替换 仿真 组 件 。 这 些 
组 件 不 必 是 最 终 的 组 件 。 可 以 近似 于 系统 本 身 ， 但 是 在 精度 上 必须 高 于 仿真 
组 件 。 

注意 ， 现 在 讨论 的 是 在 某 台 计 算 机 上 通过 软件 “仿真 ” 另 一 台 计 算 机 ， 关 于 
这 点 一 直 没 有 一 个 明确 的 定义 。 然 而 它 可 以 被 认为 与 定义 相 一 致 ， 因 为 用 于 仿真 的 
计算 机 并 不 仅仅 只 用 于 仿真 。 相 反 ， 它 的 速度 往往 高 于 仿真 速度 。 
定义 : 快速 原型 是 执行 SUD 模型 的 执行 过 程 ， 没 有 任何 组 件 在 计算 机 上 被 进行 仿 
真 。 相 反 ， 所 有 的 组 件 都 是 真实 组 件 ， 其 中 的 某 些 组 件 不 应 该 是 最 终 使 用 的 组 件 
《否则 这 就 是 一 个 真实 的 系统 ) 。 

在 许多 情况 下 ， 在 最 终 的 版 本 制造 之 前 ， 应 尝试 在 真实 的 环境 中 进行 系统 设 
计 。 汽 车 的 控制 系统 就 是 一 个 很 好 的 例子 。 在 大 量 的 产品 使 用 前 ， 应 先 通过 驾驶 员 
在 不 同 环境 中 的 使 用 ， 来 进行 系统 研制 。 因 此 ， 这 就 需要 汽车 进行 工业 原型 设计 。 
这 些 原型 系统 更 接近 于 最 终 的 系统 ， 但 是 它们 有 可 能 更 大 ， 消 耗 更 多 的 功率 以 及 具 
有 其 他 各 种 能 够 被 测试 的 驾驶 员 所 接受 的 特点 。“ 原 型 ”可 以 是 整个 系统 ， 也 可 以 
是 电气 或 机 械 系统 。 然 而 快速 原型 与 仿真 之 间 的 区 别 也 有 些 模 糊 。 快 速 原型 的 概念 
也 非常 宽泛 ， 本 书 也 无 法 将 其 全 部 覆盖 。 

通过 使 用 FPCA， 可 以 建立 和 仿真 原型 。 当 测试 的 驾驶 员 驾 驶 车 辆 时 ， 可 以 将 
FPGA 放 在 车 的 行李 箱 中 。 这 种 做 法 不 仅 限于 汽车 行业 ， 还 有 其 他 几 个 使 用 FPGA 
建立 原型 的 例子 。 市 场 上 可 以 买 到 的 仿真 器 都 包含 着 大 量 的 FPGA， 它 们 只 需要 用 
对 应 的 映射 工具 去 映射 对 应 的 规格 说 明 就 可 以 实现 对 不 同系 统 的 仿真 。 通 过 使 用 这 
些 仿真 器 ， 最 终 的 试验 系统 就 可 以 “几乎 ” 像 一 个 真实 的 系统 那样 运行 。 在 非 分 
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布 式 系统 中 使 用 仿真 或 者 原型 去 发 现 错误 是 个 问题 ， 对 于 分 布 式 系统 来 说 ， 这 种 情 
况 变 得 更 加 困难 (例如 Tsai [Tsai and Yang，1995] ) 。 


5.8 形式 验证 


形式 验证 是 通过 使 用 数学 语言 ， 形 式 地 证 明 系 统 的 正确 性 。 首 先 ， 需 要 一 个 
可 被 形式 验证 可 用 的 形式 模型 ， 这 一 步 很 难 通 过 自动 化 来 生成 ， 所 以 此 处 可 能 需要 
较 多 的 工作 。 一 旦 确定 模型 是 可 用 的 ， 就 可 以 尝试 去 证 明 某 些 属性 。 

形式 验证 技术 可 以 用 逻辑 类 型 进行 分 类 . 

1) 命题 逻辑 : 在 这 种 情况 下 ,模型 由 布尔 函数 组 成 。 这 些 工具 被 称 作 布尔 检 
查 器 、 同 意 检 查 器 或 等 值 检 查 器 ， 它 们 用 来 验证 两 种 布尔 函数 (或 布尔 函数 的 集 
合 ) 是 等 价 的 。 由 于 命题 逻辑 可 以 判定 ， 它 也 可 以 用 于 判定 两 种 表达 式 是 否 等 价 
《这 是 毫 无 疑问 的 ) 。 例 如 ， 一 个 表达 式 既 可 以 与 实际 电路 中 的 门 电路 对 应 ， 也 可 
以 与 其 他 规范 对 应 。 当 提供 了 设计 类 似 的 表达 式 后 ， 需 要 通过 等 值 检查 器 去 检测 设 
计 (例如 ， 电 源 优化 ) 是 否 正确 。 布 尔 检查 器 可 以 应 对 大 多 数 的 ， 基 于 仿真 的 详 
细 验 证 。 布尔 检查 器 功能 强大 的 原因 是 由 于 使 用 了 二 又 决策 图 (Binary Decision Di- 
agram, BDD) [ Wegener，2000] 。 以 二 又 决策 图 来 表示 布尔 函数 的 等 值 检查 器 的 复 
杂 度 ， 与 二 又 决策 图 的 节点 数量 成 线性 关系 。 与 之 相反 ， 用 于 等 值 检查 的 函数 由 大 
量 的 非 确定 性 多 项 式 来 表示 。 因 此 ， 基 于 二 又 决策 图 的 等 值 检查 器 可 以 替代 仿真 器 
用 于 拥有 数 以 百 万 计 二 极 管 的 电路 。 

2) 一 阶 逻 辑 (First Order Logic, FOL): FOL 包括 以及 V 操作 符 。 通 常情 况 
下 ， 整 形 数据 可 以 进行 运算 。 这 样 ， 自 动 化 验证 FOL 模型 就 是 可 行 的 。 然 而 ， 由 
于 FOL 不 可 判定 ， 在 某 些 情况 下 ， 有 一 定 的 不 确定 性 。 霍 尔 微 积 分 就 是 一 种 常用 
的 FOL 技术 。 

高 阶 逻辑 (Higher Order Logic, HOL): 高 阶 基于 入 演算 并 且 可 以 像 其 他 的 对 
象 一样 操 作 函 数 [ University of Cambridge, 2010], 高 阶 逻辑 已 经 被 证 明 不 可 能 
自动 化 的 方式 进行 验算 ， 并 且 通 常 需要 手动 进行 验算 支持 。 

命题 逻辑 可 以 用 来 验证 无 状态 的 逻辑 网 络 ， 但 不 能 直接 模拟 有 限 状 态 机 。 对 于 
短 输 入 序列 ， 它 可 能 足以 削减 有 限 状 态 机 中 的 反馈 环 ， 并 且 可 以 有 效 地 处 理 这 些 有 
限 状态 机 的 副本 ， 每 一 个 副本 都 代表 着 一 个 输入 类 型 的 影响 。 然 而 ， 这 种 方法 不 适 
合用 于 较 长 的 输入 序列 。 这 种 序列 可 以 使 用 模型 校 验 进行 处 理 。 

对 于 模型 校 验 ， 有 如 下 两 种 输入 验证 工具 : 

1) 模型 验证 ; 











O ”形式 验证 部 分 的 说 明 来 自 于 客座 教授 Tiziana Margaria- Steffen (来 自 多 特 蒙 德 理工 大 学 ) 。 
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2) 属性 验证 。 

状态 可 以 通过 无 法 用 数字 量化 的 以 及 V 符号 量化 。 验 证 工具 可 以 用 于 证 明 或 
者 反 证 属性 。 对 于 后 者 ， 可 以 提供 一 个 反例 。 模 型 验证 相 较 于 FOL 更 容易 实现 自 
动 化 。 它 在 1987 年 通过 使 用 BDD 首次 实施 。 它 有 可 能 在 总 线 的 协议 规范 中 定位 若 
干 的 错误 [Clarke et al. , 2005]. 

下 一 步 将 会 尝试 整合 模型 检查 器 以 
及 高 阶 逻 辑 。 在 这 种 集成 模型 中 ,高 阶 i 
逻辑 只 在 绝对 需要 时 才 会 被 使 用 0 

Clarke 的 EMC 系统 [Clarke and et 
al. , 2003] ( 见 图 5. 19) 可 以 作为 该 方 
法 的 一 个 示例 。 Beene 

该 系统 尝试 使 用 CTL 公式 描述 系 图 5.19 Clarke 的 EMC 系统 
统 。CTL 公式 包括 两 个 部 分 : 

1) 路 径 计 算 器 (这 部 分 指定 路 径 中 的 状态 转换 图 ) ; 

2) 状态 计数 器 (这 部 分 指定 状态 ) 。 

例如 : MW，s 上 4Cg 意味 着 : 在 转换 图 M 中 ， 有 -一 个 适用 于 所 有 路 径 〈 由 4 表 
示 ) 的 属性 g 开始 时 的 状态 与 所 有 状态 (由 G 表示 )。 可 以 延伸 用 于 表达 覆盖 实时 
及 数字 行为 。 

这 种 技术 还 可 用 于 ， 如 证 明 铁路 属性 的 模型 ， 如 图 2. 52 所 示 。 它 可 以 转换 为 
状态 图 的 Petri 网 ， 然 后 确认 巴黎 以 及 科隆 之 间 的 列车 数量 是 恒定 的 ， 这 证 实 了 关 
于 2.6.3 节 讨 论 的 Petri 网 的 不 变量 。 


CL] 








5.9 思考 题 


1. 考虑 一 个 有 关 帕 累 托 最 优 的 概念 的 例子 。 在 本 例 中 ， 学 习 由 IMEC 研究 中 心 
设计 的 并 发 任务 管理 (TCM) 工具 。TCM 工具 用 于 在 应 用 程序 与 处 理 器 间 进 行 有 
效 映射 。 不 同 的 多 处 理 器 系统 评估 ， 用 帕 累 托 最 优 设计 表示 。Wong 等 人 [ Wong et 
al. , 2001] 描述 了 不 同 的 MEPG-4 播放 器 的 设计 方案 。 作 者 在 此 处 假定 使 用 
StrongARM 处 理 器 以 及 特别 的 加 速 器 的 组 合 。 该 设计 应 满足 30ms 的 时 间 约 束 ( 见 


E 5.20), 
处 理 器 组 合 MENE 4 
高 速 处 理 器 数量 6|5]4] 3 
低速 处 理 器 数量 0|1315 7 
总 处 理 器 数量 6|8|9|10 


图 5.20 处理 器 配置 
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这 些 不 同 的 设计 如 图 5.21 所 示 。 














配置 2 
ASO) ga, 
6 et 
480 -| 5 4X 2 1 
470 + P- 
460 - 
5 
E 450- 
i 440- 
zl @---- ; 
"a $ ga 帕 累 托 优化 设计 点 
410 — ai 
400 + 4 8 ww -i 
390 T T | T T T = 
24 25 26 27 28 29 30 时 间 /ms 
图 5.21 多 核 处 理 器 系统 配置 2 以 及 配置 3 的 帕 累 托 点 


对 于 组 合 1 和 4， 作 者 报告 中 提 到 ， 只 有 一 个 处 理 器 到 任务 之 间 的 映射 满足 时 
HAR, 

对 于 组 合 2 和 3， 不 同时 间 分 配 不 同 的 任务 导致 不 同 的 处 理 器 映射 以 及 不 同 的 
系统 功 耗 。 

哪 一 片 目标 空间 至 少 由 一 个 配置 3 所 控制 ? 有 哪些 设计 属于 不 由 配置 3 支配 的 
配置 2? 目标 空间 的 哪 片区 域 控制 着 至 少 一 个 配置 3 的 设计 ? 

2. 什么 情况 下 必须 满足 WCETest 的 计算 ? 

3. 考虑 控制 流 加 入 后 高 速 缓存 的 状态 ! 图 5. 22 显示 了 加 入 控制 流 之 前 的 高 速 
缓存 状态 。 现 在 看 一 下 加 入 控制 流 后 的 缓存 状态 ， 哪 种 状态 是 必须 分 析 得 出 的 ? 那 
种 状态 是 可 能 分 析 得 出 的 ? 

eaa 


{e} | {f} {a} | {d} 
图 5.22 抽象 缓存 状态 



































{d} | 0 {c.f} | {9} 





4. 考虑 传人 的 “ 突 发 ”事件 流 。 该 流 是 以 p 为 周期 的 周期 性 流 。 在 每 个 周期 
开始 时 ， 每 两 个 事件 的 到 达 都 以 4 作为 时 间 单 元 进行 间隔 。 优 化 该 流 的 到 达 曲 线 ! 
最 终 的 图 形 应 显示 为 0 ~3 *p。 

5. 假设 有 一 个 所 能 工作 的 最 高 性 能 为 5 的 处 理 器 。 

1) 如 果 系 统 的 服务 曲线 看 起 来 由 于 缓存 的 冲突 导致 系统 性 能 降低 到 了 0 ， 怎 
么 办 ? 

2) 如 果 每 100ms 就 有 时 钟 中 断 打 断 正在 运行 的 程序 并 且 每 次 时 钟 中 断 的 中 断 
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处 理 程序 消耗 时 间 为 10ms， 那 么 系统 的 服务 曲线 该 如 何 改变 ? 假设 此 处 没有 缓存 
冲突 。 

3) 在 考虑 类 似 1) 中 的 缓存 和 类 似 2) 中 的 中 端 情况 下 ， 服务 曲线 是 什么 
样 的 ? 

结果 图 需 显示 0 ~300ms 的 时 间 段 。 


第 6 章 应 用 程序 映射 


6.1 问题 定义 


一 旦 系统 规格 已 经 定义 完毕 ， 就 可 以 开始 设计 工作 了 。 这 与 简化 了 的 设计 信息 
流 是 一 致 的 〈 见 图 6. 1) 。 向 要 运行 的 平台 上 进行 程序 映射 确实 非常 关键 ， 因 此 在 


本 章 中 将 特别 予以 强调 。 
设计 仓库 Ho) 


a 
应 用 筹划 


优化 
评估 与 批准 












规格 说 明 书 


Ae 硬件 子 系统 


系统 软件 
(RTOS、…) 













































图 6.1 简单 设计 流 


对 于 嵌入 式 系统 来 说 ， 通 常 希望 系统 上 运行 某 些 特定 应 用 程序 的 组 合 。 例 如 对 
于 移动 电话 来 说 ,希望 可 以 在 打 电话 的 同时 ,使 用 蓝牙 将 对 应 的 音频 信号 传递 到 耳 
机 中 ， 并 且 同 时 查看 “个 人 信息 管理 (Personal Information Manager，PIM ) ”去 查 
找 某 些 信息 。 期 望 在 同一 时 间 可 以 并 发 的 进行 文件 传输 ， 甚 至 是 视频 连接 。 必 须 确 
保 这些 应 用 程序 可 以 同时 工作 并 且 还 能 保证 其 死 线 (不 丢失 音频 采样 !) 。 通 过 用 
例 分 析 ， 可 以 确保 上 述 场景 是 可 行 的 。 

这 也 是 说 入 式 物理 子 系统 的 一 个 特点 ， 就 是 在 设计 阶段 就 要 同时 考虑 软件 和 硬 
件 ， 因 此 这 种 类 型 的 设计 也 被 称 作 软 、 硬 件 协同 设计 。 总 的 目标 就 是 尽 可 能 找 出 最 
合适 的 软 、 硬 件 组 合 的 方式 ， 最 快捷 、 有 效 地 满足 产品 设计 规范 。 因 此 ， 衣 人 式 系 
统 不 能 仅仅 是 只 简单 地 将 各 个 进程 按照 规范 进行 组 合 ， 相 反 每 一 个 用 到 的 组 件 ， 都 
必须 说 明 引 用 该 组 件 的 原因 。 当 然 ， 也 有 其 他 原因 导致 该 约束 的 产生 ， 那 就 是 为 了 
满足 髋 入 式 系 统 日 益 增长 的 复杂 度 以 及 迫切 的 市 场 需求 ， 重 用 从 本 质 上 来 说 就 是 不 
可 避免 的 。 由 此 得 出 了 基于 平台 的 设计 原则 。 


硬件 平台 是 远 远 不 够 的 。 快 速 、 可 靠 以 及 扩展 的 设计 ， 需 要 一 个 通用 的 平台 API 用 
于 平台 的 应 用 软件 。 一 般 来 说 ,平台 是 一 个 在 底层 可 以 覆盖 大 多 数 可 能 用 到 的 功能 
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的 抽象 层 。 基 于 平台 的 设计 是 一 种 折 中 的 方法 : 在 自 顶 向 下 的 设计 过 程 中 ， 设 计 师 
将 一 个 位 于 上 层 平台 的 实例 映射 到 底层 平台 上 ， 并 且 进 行 一 些 设计 上 的 约束 .” 
[Sangiovanni- Vincentelli，2002 ] 。 映 射 就 是 在 性 能 评估 工具 引导 下 的 迭代 过 程 。 

在 本 书 中 ， 关 注 于 可 供 执行 平台 的 嵌入 式 系统 设计 ， 这 也 反映 了 许多 现代 系统 
是 建立 在 某 些 已 经 存在 的 平台 上 的 事实 。 本 书 描述 的 技术 是 基于 可 执行 平台 的 设 
计 ， 并 且 已 被 实际 应 用 。 鉴 于 人 们 的 关注 点 ， 应 用 程序 在 可 执行 平台 上 的 映射 可 以 
被 看 作 主 要 的 设计 问题 。 

映射 的 执行 通常 基于 多 核 处 理 器 系统 ， 一 般 而 言 有 如 下 两 种 多 核 处 理 器 系统 . 

1) 同 构 多 处 理 器 系统 : 在 这 种 情况 下 ， 系 统 中 的 所 有 处 理 器 都 提供 同样 的 功 
能 ， 这 是 类 似 于 PC 系统 的 多 核 处 理 器 架构 。 不 同 处 理 器 之 间 的 代码 兼容 性 是 其 主 
要 优势 : 它 可 以 在 不 同 的 核 之 间 进行 任务 的 调度 (包括 负载 均衡 )， 并 且 在 系统 容 
错 设 计 上 也 有 不 少 优势 。 如 果 某 个 处 理 器 发 生 故 障 ， 可 以 将 进程 重新 分 配 到 其 他 处 
理 噩 上 和 运行。 此外， 如 果 所 有 处 理 器 的 类 型 都 是 相同 的 ， 那 么 处 理 器 平台 的 开发 设 
计 工 具 的 使 用 就 会 变 得 更 加 简单 、 方 便 。 

2) 异 构 多 处 理 器 系统 : 在 这 种 情况 下 ， 有 多 种 类 型 的 处 理 器 。 使 用 这 种 方法 
的 关键 原因 是 这 种 方法 有 同 构 处 理 器 系统 所 达 不 到 的 性 能 优势 。 异 构 多 处 理 器 系统 
是 最 高 效 的 编程 平台 。 

即使 是 基于 平台 的 设计 ， 可 能 也 有 着 若干 种 设计 方案 。 有 可 能 选择 一 个 平台 的 
不 同 变种 ， 例 如 某 个 变种 有 着 不 同 数量 的 处 理 器 、 某 个 变种 有 着 不 同 速度 的 处 理 器 
或 者 不 同 的 通信 架构 。 此 外 ， 适 用 的 调度 策略 也 会 有 着 不 同 的 变化 。 只 能 在 多 种 方 
案 中 选择 恰当 的 一 种 。 

这 使 得 对 映射 的 问题 定义 如 下 [Thiele，2006a] : 

给 定 : 

1) 一 组 应 用 程序 ; 

2) 用 于 描述 应 用 程序 该 怎样 使 用 的 使 用 案例 ; 

3) 一 组 可 能 的 候选 架构 : 

中 (可 能 是 异 构 的 ) 处 理 器 ， 

@ (可 能 是 异 构 的 ) 通信 架构 ， 

© 可 能 的 调度 策略 。 

找 出 : 

1) 应 用 程序 在 处 理 器 上 的 映射 ; 

2) 合适 的 调度 技术 (如 果 没 有 准备 好 ); 

3) 目标 架构 (如 果 没 有 准备 好 ) 。 

宗旨 : 

1) 保证 系统 死 线 以 及 最 佳 性 能 ; 

2) 要 降低 系统 成 本 、 系 统 功 耗 以 及 其 他 可 能 达到 的 目标 。 
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寻找 可 能 的 架构 方案 被 称 作 设计 空间 探索 (Design Space Exploration, DSE), 
一 个 完全 固定 的 平台 架构 可 以 被 看 作 一 个 特例 。 

基于 AUTOSAR 设计 的 汽车 系统 可 以 被 用 作 一 个 示例 : 在 AUTOSAR [ AUTO- 
SAR, 2010] 中 ， 有 若干 同 质 执行 单元 (被 称 作 ECU) 以 及 若干 软件 构件 。 问 题 
就 是 ， 如 何在 满足 实时 性 约束 的 前 提 下 ,使 用 最 低 数量 的 ECU， 并 将 软件 构件 映 
射 到 ECU 上。 

应 用 程序 的 映射 是 一 个 非常 难 解决 的 问题 ， 应 用 程序 的 自动 映射 还 没有 实现 。 
接 下 来 ， 将 展示 一 些 用 于 映射 的 模块 : 

1) 标准 调度 技术 ; 

2) 硬件 /软件 分 区 ; 

3) 将 一 组 应 用 映射 到 多 处 理 器 系统 上 的 技术 。 

下 面 将 介绍 可 以 用 于 不 同情 况 下 的 标准 调度 技术 的 说 明 。 





6.2 实时 系统 中 的 调度 


如 前 面 所 述 ， 调 度 是 实现 舰 和 人 式 系统 的 关键 因素 之 一 。 在 设计 系统 时 ， 有 可 能 
要 对 调度 算法 进行 若干 次 调整 。 系 统 规格 一 旦 确定 后 ， 对 于 调度 算法 的 使 用 就 有 了 
一 个 大 概 的 估算 。 接 下 来 ， 可 能 需要 更 加 详细 的 有 关 执行 时 间 的 预测 。 在 代码 编译 
后 ， 可 以 获得 更 详细 的 有 关 执 行 时 间 的 细节 以 及 更 精准 的 调度 规划 ， 最 终 决 定 后 续 
任务 该 如 何 被 执行 。 但 与 之 相反 的 是 ， 在 基于 时 间 触 发 的 系统 中 ，RTOS 的 调度 器 
仅仅 通过 简单 的 查 表 来 选择 哪个 进程 被 调度 。 调 度 也 像 进 行 性 能 评估 一 样 ， 并 不 能 
仅仅 在 设计 的 某 一 个 步骤 中 就 决定 使 用 何 种 调度 方式 。 
调度 右 定 义 了 每 个 任务 的 开始 时 间 ， 并 且 定 义 了 从 7 到 每 个 任务 图 G = (了 ， 
E) 到 时 域 D, 的 节点 的 映射 : 
7: VD, (6.1) 


6.2.1 调度 算法 分 类 


调度 算法 可 以 根据 不 同 的 标准 进行 分 类 。 图 6.2 显示 了 其 中 的 一 种 分 类 方法 
(类 似 的 方法 在 [ Balarin et al. , 1998], [Kwok and Ahmad, 1999], [Stankovic et 
al. , 1998], [Liu, 2000], [ Buttazzo, 2002 ] 的 书籍 中 各 有 讨论 ) 。 

接 下 来 是 一 个 有 关 分 类 标准 的 讲述 ， 前 4 种 方式 都 与 图 6. 2 相关 : 

1) 软 死 线 以 及 硬 死 线 : 基于 软 死 线 的 调度 算法 通常 是 在 标准 操作 系统 上 进行 
扩展 。 例 如 ， 提 供 任务 所 需 的 系统 调用 的 优先 级 的 确定 ， 使 用 基于 软 死 线 的 系统 就 
足 疾 ， 本 书 不 会 更 进一步 讨论 此 类 系统 ， 本 书 将 会 把 更 多 的 精力 放 在 硬 死 线 系统 
上 ， 这 些 问 题 将 在 周期 系统 和 非 周期 系统 上 讨论 。 

2) 基于 周期 和 非 周 期 的 任务 调度 : 接 下 来 ,首先 要 分 辨 什么 是 周期 任务 ， 什 
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实时 调度 
硬 死 线 软 死 线 
周期 性 的 非 周期 性 的 
抢占 调度 非 抢占 调度 抢占 调度 非 抢占 调度 


ee. a ee a ee 


静态 调度 ”动态 调度 静态 调度 。 ”动态 调度 ”静态 调度 AAWE PAWE “动态 调度 
图 6.2 调度 算法 分 类 


么 是 非 周期 任务 。 

定义 : 在 每 个 以 p 为 单元 时 间 内 ， 都 要 执行 一 次 的 任务 ， 叫 做 周期 性 任务 。b 被 称 
为 是 这 些 任务 的 周期 。 每 一 个 周期 任务 的 执行 过 程 被 称 作 工作 。 

定义 : 不 以 固定 周期 运行 的 任务 被 称 作 非 周期 任务 。 

定义 : 如 果 在 申请 处 理 器 时 有 一 个 最 小 间隔 时 间 ， 那 么 非 周期 性 任务 在 不 可 预知 的 
时 间 进 行 处 理 器 请 求 被 称 作 突 发 请 求 。 

这 个 最 小 间隔 非常 重要 ， 因 为 如 果 程 序 组 没有 这 个 最 小 间隔 时 间 ， 则 无 法 进行 
进程 调度 。 因 为 如 果 任务 一 旦 变 得 可 执行 ， 那 么 有 可 能 没有 足够 的 时 间 来 进行 任务 
的 执行 。 

3) 抢占 以 及 非 抢 占 调度 : 非 抢 占 调度 基于 程序 能 够 一 直 运 行 到 程序 自我 执行 
完毕 的 假设 。 因 此 ， 如 果菜 些 任务 执行 时 间 过 长 ， 那 么 对 于 某 些 外 部 事件 9 的 响应 
时 间 可 能 会 变 得 相当 长 。 如 果 某 些 任务 需要 较 长 的 运行 时 间 ， 或 者 系统 要 求 对 外 部 
事件 的 响应 时 间 需 尽 可 能 短 ， 那 么 就 需要 使 用 抢占 式 调度 。 然 而 ， 抢 占 式 调度 有 可 
能 导致 系统 的 运行 时 间 变 得 不 可 预测 。 因 此 ， 对 于 某 些 硬 实 时 任务 来 说 ， 要 限制 抢 
占 ， 以 保证 硬 实 时 任务 能 够 在 死 线 到 来 前 结束 运行 。 

4) 静态 与 动态 调度 : 动态 调度 在 任务 运行 时 决定 调度 策略 。 这 种 调度 方式 非 
常 灵活 ， 但 是 会 在 运行 时 产生 一 定 的 系统 开销 。 此 外 ， 该 方式 通常 不 关注 全 局 的 系 
统 上 下 文 ， 例 如 资源 需求 或 任务 间 的 依赖 。 对 嵌入 式 系统 来 说 ， 这 种 全 局 的 上 下 文 
在 系统 设计 时 就 应 该 被 考虑 。 

静态 调度 在 设计 时 就 应 决定 该 如 何 调度 。 此 种 调度 方法 基于 规划 好 任务 的 起 始 
时 间 ， 并 生成 一 个 任务 起 始 时 间 表 ， 交 付 到 一 个 简单 的 调度 器 中 。 调 度 器 并 不 做 任 
何 调度 决策 ， 仅 仅 是 根据 调度 表 中 指明 的 任务 起 始 时 间 开始 任务 运行 。 调 度 器 可 以 
由 时 钟 进行 控制 ， 并 进行 调度 表 的 分 析 。 完 全 由 时 钟 控制 的 系统 被 称 作 完全 时 钟 触 





O 这 是 从 外 部 事件 发 生 到 外 部 事件 处 理 结束 的 响应 时 间 。 
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发 系统 (Time Triggered, TT) 系统 。 此 类 系统 在 Kopetz [ Kopetz, 1997] 的 书籍 中 
有 详细 论述 

“在 一 个 完 全 时 钟 触 发 系统 中 ， 所 有 任务 的 时 序 控制 结构 首先 由 某 种 离线 支持 
工具 建立 。 这 个 时 序 控 制 结构 包含 在 了 任务 描述 符 表 (Task- Descriptor List, TDL) 
中 ， 该 表 包 含 了 所 有 活动 任务 的 调度 
周期 0 (SLA 6.3 ) 。 这 个 调度 表 考 上 
虑 到 了 任务 所 必需 的 优先 级 以 及 任务 | | Anje 
间 的 互 斥 关系 ， 以 致 操作 系统 在 运行 | 2 停止 Ti 
时 对 任务 调度 的 协调 工作 是 完全 不 必 a a ve 
要 的 "。 图 6.3 包括 了 调度 器 中 任务 | a 
开始 、 任 务 结 束 以 及 消息 发 送 的 
di, 图 6.3 时间 触发 系统 中 的 TDL 

“调度 器 由 同步 的 时 钟 滴答 激 
活 。 激 活 后 首先 观察 TDL， 并 根据 TDL 的 表 项 立即 执行 原 定 的 调度 计划 …”。 

静态 调度 器 的 主要 优点 是 ， 如 果 系 统 满足 原 定 的 时 间 约 束 ， 那 么 系统 很 容易 进 
行 检查 : 

“为 了 满足 硬 实时 系统 的 时 间 约 束 ， 系 统 的 可 预测 性 就 变 得 更 加 重要 ; 相对 于 
复杂 系统 而 言 ， 预 运行 时 间 调 度 往往 是 提供 系统 可 预见 性 的 惟一 手段 ” Xu and 
Parnas, 1993], 

静态 调度 器 的 主要 不 足 是 对 于 突 发 事件 的 反映 显得 缺乏 手段 。 

5) 独立 任务 以 及 相关 任务 : 区 分 某 个 任务 是 否 与 其 他 任务 有 进程 间 的 通信 是 

可 能 的 。 对 般 入 式 系统 来 说 ， 任 务 之 间 经 常会 有 依赖 关系 ， 没 有 依赖 关系 的 任务 往 
往 是 种 例外 。 

6) 单 处 理 器 调度 与 多 处 理 器 调度 : 简单 的 调度 算法 通常 用 于 单 处 理 器 系统， 
反之 复杂 的 调度 算法 用 于 处 理 多 处 理 器 组 成 的 系统 。 对 于 后 者 ， 可 以 区 分 同 质 多 处 
理 器 算法 以 及 异 构 多 处 理 器 算法 。 异 构 多 处 理 器 算法 可 以 有 针对 性 地 处 理 执行 时 间 
以 及 用 于 混合 的 软 /硬件 系统 ， 并 将 其 中 的 某 些 任务 映射 到 硬件 。 

7) 集中 式 调 度 以 及 分 布 式 调度 : 多 处 理 器 调度 算法 既 可 以 在 某 个 局 部 处 理 器 
上 进行 调度 ， 也 可 以 分 布 到 多 个 处 理 器 上 进行 调度 。 

8) 可 调度 性 类 型 以 及 复杂 度 测试 : 实际 上 ， 是 否 有 一 个 满足 给 定 的 一 组 任务 
限制 的 调度 器 是 非常 重要 的 。 

如 果 有 一 组 任务 以 及 对 应 的 限制 规则 存在 的 情况 下 ， 还 存在 一 个 调度 表 ， 那 么 
就 说 这 组 任务 在 给 定 的 限制 下 是 可 调度 的 。 对 于 许多 应 用 程序 来 说 ， 可 调度 性 测试 





时 间 行为 WCET 
i 


























O ”这 个 术语 用 于 在 此 场景 下 的 处 理 器 。 
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非常 重要 。 在 许多 情况 下 ， 使 用 非 确 定性 多 项 式 可 以 返回 一 个 精确 的 (被 称 作 确 
切 概率 法 ) 测试 结果 [Garey and Johnson, 1979 ] 。 因 此 充分 性 以 及 必要 性 的 测试 ， 
都 要 用 该 多 项 式 进行 测试 。 对 于 充分 性 测试 ， 要 保证 调度 器 进行 充分 的 状态 检查 。 
检查 结论 要 指明 即使 有 调度 表 存 在 的 情况 下 ， 调 度 器 依旧 不 能 进行 调度 的 概率 
(希望 这 个 值 尽 可 能 小 ) 。 必 要 性 测试 基于 检查 系统 的 必要 状态 ， 这 种 测试 可 以 在 
没有 调度 表 的 情况 下 进行 验证 。 所 以 ， 即 使 调度 表 不 存在 ， 必 要 性 验证 依然 有 可 能 
通过 。 

9) 成 本 函数 : 不 同 的 算法 旨 在 最 大 限度 地 减 小 函数 的 规模 ， 最 大 延迟 通常 用 
于 成 本 函数 中 。 
定义 : 最 大 延迟 定义 为 所 有 任务 的 完成 时 间 与 死 线 之 间 的 最 大 差 值 。 如 果 所 有 任务 
在 它们 的 死 线 之 前 执行 完毕 ， 那 么 最 大 延迟 的 值 为 负 。 


6.2.2 没有 优先 级 约束 的 非 周期 性 调度 











6.2.2.1 定义 
假如 IT) 是 一 组 任务 , 让 ( 见 
图 6.4): 任务 有 效 时 间 - - - 
1) Ci 是 T; 的 执行 时 间 ; i 
2) d, 是 死 线 的 间隔 时 间 ， 换 言 > 
Z, ER T 结束 运行 之 前 ，7 之 间 oe 
的 时 间 都 是 有 效 的 。 和 Rte 


3) L 是 闲置 的 时 间 ， 定 义 为 
l, =d; -c; (6.2) 

此 外 ， 向 上 的 箭头 指明 任务 开始 有 效 的 时 间 ， 向 下 的 箭头 指明 了 任务 的 死 线 。 

如 果 1, =0, ABA T, 在 其 变 为 可 执行 状态 时 ， 要 立即 执行 。 

首先 考虑 ”在 单 处 理 器 系统 中 ， 所 有 任务 同时 到 达 的 情况 ， 如 果 所 有 任务 同时 
到 达 ， 那 么 抢占 就 变 得 没有 意义 。 
6.2.2.2 最 早 交付 日 期 算法 

Jackson 在 1955 4F [ Jackson, 1955] 首先 提出 了 最 早 交 付 日 期 (Earliest Due 
Date, EDD) 算法 这 种 简单 的 调度 算法 ， 该 算法 基于 Jackson 提出 的 规则 . 

该 算法 是 给 定 一 组 二 个 独立 任务 ， 在 没有 达到 死 线 的 所 有 任务 中 ， 选 择 _ 个 距 
离 死 线 最 近 的 任务 执行 的 算法 。 

遵守 这 种 规则 的 算法 被 称 作 EDD 算法 。 如 果 能 够 提前 知道 任务 死 线 ，EDD 算 











O 这 里 使 用 了 Buttazzo [Buttazzo, 2002] 所 著 书 籍 中 的 某 些 部 分 来 阐述 此 部 分 。 如 想 获得 额外 的 参考 ， 
可 以 查阅 此 书 。 
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法 可 以 用 作 一 种 静态 调度 算法 。EDD 算法 需要 所 有 的 任务 根据 其 死 线 进行 排序 ， 
因此 其 算法 复杂 度 为 0(nlog(n) ) 。 


























EDD 系统 的 性 能 验证 如 下 : 

让 作为 由 算法 4 生成 的 调度 表 。 假 设 4 得 出 的 结论 与 EDD 不 同 。 接 下 来 ， 
HERPA T, 与 7, 两 个 任务 , 尽管 | ALE | 
T, 的 死 线 先 于 T, (d, <d,), 但 7, 在 
T, 之 前 运行 。 现 在 考虑 调度 表 7', ro v TEF | 
由 交换 7 中 的 T, 以 及 T, 的 执行 顺序 | = 
得 出 ( 见 图 6.5)。 ul 

Lala, b) =f, - d, 是 调度 表 T 图 6.5 调度 表 7 以 及 7 


中 任务 T, 5 T, 的 最 大 延迟 。 对 于 调度 表 r KiM, L'ala, b) =max(L',, L) 是 
任务 T, 与 7, 中 有 最 大 延迟 的 一 个 。L', 是 任务 T, 在 调度 表 7' 中 的 最 大 延迟 ，L'， 
的 定义 与 之 相符 。 有 如 下 两 种 可 能 的 情况 : 

1) L'。 >L',， 在 这 种 情况 下 有 

Dw 0,b) =f, -d, 
T, 在 新 的 调度 表 中 较 早 停止 ， 因 此 有 
Lo mph @sb) =f, d, <fa -d, 
不 等 式 的 右 侧 是 调度 表 r 中 的 最 大 延迟 ， 因 此 接 下 来 有 
EF ouch Bf SB LOD) 
2) L',<L',， 在 这 种 情况 下 有 
L'sa( a,b0) =f,-d,=f, -di( 见 图 6.5) 
T, 的 死 线 比 T, 提前 到 达 ， 这 导致 
L's (a,b) <f, -d, 
接 下 来 有 
L'il a,b) <Laa,b) 

作为 结论 ， 任 何 调度 器 ( 即使 不 是 EDD 调度 器 ) ， 也 可 以 通过 对 有 限 的 任务 
转换 实现 EDD 调度 。 最 大 延迟 只 可 以 通过 任务 的 转换 降低 。 因 此 ，EDD 是 所 有 调 
度 算 法 中 的 最 优 算法 。 
6.2.2.3 最 早 到 期 优先 算法 

下 面 考虑 在 单 处 理 器 系统 下 ， 不 同 的 任务 到 达 时 间 的 情况 。 在 这 种 情况 下 ， 抢 
占有 可 能 减少 最 大 延迟 。 

最 早 到 期 优先 (Earliest Deadline First, EDF) 算法 可 以 优化 最 大 延迟 时 间 。 该 
算法 基于 如 下 原理 [ Horn, 1974]: 

给 定 一 组 具有 任意 到 达 时 间 的 个 独立 任务 ， 任 何 具 有 最 早 绝对 死 线 的 ， 已 经 
准备 好 立刻 可 以 执行 的 任务 ， 无 论 是 由 何 种 算法 ， 其 最 终 意义 都 是 优化 器 最 大 
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EDF 要 做 的 是 ， 每 当 有 一 个 准备 就 绪 的 任务 到 来 时 ， 都 根据 其 死 线 排序 ， 并 
将 其 插入 一 个 任务 的 就 绪 队 列 中 ， 因 此 EDF 是 一 个 动态 调度 算法 。 如 果 一 个 新 到 
来 的 任务 被 排 在 了 就 绪 队 列 的 首部 ， 那 么 当前 正在 执行 的 任务 就 会 被 抢占 。 如 果 队 
列 使 用 一 个 排序 表 ， 那 么 EDF 的 时 间 复 杂 度 为 O(n?) Bucket 数组 可 以 用 于 减少 
执行 时 间 。 

图 6.6 显示 了 由 EDF 算法 得 出 的 调度 表 ， 垂 直 的 箭头 指示 了 到 达 的 任务 。 
































| 到 达 时 刻 | 持续 时 间 | ” 死 线 
T,| 0 10 33 
任务 到 达 T,| 4 3 28 
| 
Y 3 "| 5 10 29 
n E FE 
ES | : : 
| 
T i | 





图 6.6 EDF 调度 


在 时 刻 4， 任 务 T, 有 一 个 较 早 的 死 线 。 因 此 T, Hd Tio ÆA 5, (EST, 到 
达 。 由 于 其 死 线 较 晚 ， 所 以 T, RERE T. 

最 优 EDF 证 明 如 下 : 

7 是 由 算法 A 所 得 出 的 调度 表 ， 算 法 4 不 基于 EDF 算法 。 调 度 表 7 基于 EDF 
算法 。 现 在 将 时 间 分 割 为 以 长 度 1 为 单位 的 不 相交 的 区 间 ， 每 一 段 时 间 间 隔 都 由 区 
间 (2, ¢+1) ARo Ert) 作为 按照 预定 调度 计划 7 执行 的 任务 , 在 [t, 1+1) 
的 间隔 内 运行 。 让 E(t) 作为 所 有 任务 中 具有 最 早死 线 时 间 的 任务 ， 让 t, (1) 作为 
任务 E(t) 在 7 调度 表 中 的 开始 执行 时 间 (>t). 

7 并 不 是 EDF 调度 器 ， 因 此 在 1 时刻 必然 有 一 个 具有 最 早死 线 的 任务 停止 执 
行 。 对 于 1, 有 7(!) 六 E(1) ( 见 图 6.7)。 死 线 由 向 下 的 箭头 表示 。 





t (t)=3 ECD=2 ip=S\. *(t)=2 
= cana 
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图 6.7 调度 表 7 
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证 明 的 基础 思路 是 显示 对 7(1) E(t) 的 交换 ( 见 图 6.8) 不 会 增加 最 大 
延迟 。 














Tı | et 
72 = A | 
l 
T3 r = T 得 四 | S < mrg 4 > 
7 8 9 10 11 t 


图 6.8 互 换 任务 r(i) E(t) 后 的 调度 情况 


假设 D 是 最 晚 死 线 ， 由 7 中 生成 evs 在 大 多 数 D 互 换 的 情况 下 的 算法 : 
for (t=0 to D-1) { 
if (c(t) A E(t)) { 
T(te) = T(t); 
t(t) = E(t); }} 
通过 使 用 与 Jackson 规则 相同 的 参数 可 以 得 知 ， 任 务 的 互 换 不 会 增加 最 大 延迟 。 
因此 ， 任 何 非 EDF 调度 器 都 可 以 在 不 增加 最 大 延迟 的 情况 下 转化 为 EDF 调度 器 。 
这 意味 着 EDF 是 所 有 可 用 的 调度 算法 中 ， 最 优 的 一 种 。 倘 若 这 些 任 务 仍 旧 在 调度 
表 7 中 ， 那 么 可 以 得 知 ， 任 务 的 互 换 不 会 导致 其 死 线 产生 任何 变化 。 首 先 考虑 任务 
E(t) ， 该 任务 将 会 比 之 前 的 调度 表 中 的 时 间 更 早 的 运行 ， 因 此 如 果 该 任务 在 原 有 
的 调度 表 中 有 死 线 ， 它 也 会 在 新 的 调度 表 中 遇 到 死 线 。 接 下 来 考虑 任务 (1), 
T(t) AYER EE E(t) 更 大 ， 因 此 如 果 E(t) 在 旧 的 调度 表 中 有 死 线 存在 ， 那 么 +(1) 
也 会 在 新 调度 表 中 遇 到 死 线 。 
6.2.2.4 最 小 余 度 算法 
最 小 余 度 (Least Laxity，LL) 、 最 少时 间 轮 转 优先 (Least Slack Time first, 
LST) 以 及 最 小 余 度 优先 (Minimum Laxity First, MLF) 是 另 一 种 调度 策略 的 三 个 
不 同名 称 [Liu，2000] ， 对 于 LL 调度 算法 来 说 ， 任 务 的 优先 级 是 一 个 基于 余 度 单 
调 递减 的 函数 [ILR 〈6.2) ， 余 度 越 小 ， 优 先 级 越 高 ] 。 余 度 是 动态 变化 的 ， 所 以 
也 需要 动态 的 计算 。 负 余 度 针对 死 线 的 错过 提供 了 一 个 预警 。LL 调度 器 也 支持 抢 
占 ， 抢 占 并 不 限定 于 新 任务 可 调度 的 时 间 点 上 。 
图 6. 9 显示 了 一 个 有 关 LL 调度 器 与 余 度 计算 的 示例 。 
在 时 间 点 4 上 ， 任 务 一 被 抢占 。 在 时 间 点 5 上 ， 由 于 7 的 余 度 最 小 ，7, 也 被 
抢占 。 
可 见 〈 这 是 一 个 被 用 作 思 考题 的 示例 【Liu，2000] ) ， 对 单 处 理 器 系统 来 说 ， 
在 此 种 场景 下 ，LL 调度 器 也 是 一 个 理想 调度 策略 。 对 于 其 动态 优先 级 而 言 ， 该 调 
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图 6.9 LL 调度 器 


度 器 不 能 用 于 只 提供 固定 优先 级 的 标准 操作 系统 。 此 外 ， 与 EDF 调度 器 相 比 ，LL 
调度 器 要 知道 任务 的 执行 时 间 ， 因 此 LL 调度 器 被 限制 在 某 些 对 性 能 要 求 较 高 的 特 
殊 情 况 下 使 用 。 

6.2.2.5 非 抢 占 式 调度 

如 果 不 允 许 任务 抢占 ， 那 么 理想 的 调度 器 必须 在 某 时 刻 能 够 结束 任务 ， 以 保证 
任务 不 会 越过 死 线 时 间 。 

证 明 : 假设 一 个 不 支持 抢占 的 理想 调度 器 ， 该 调度 器 即使 在 处 理 器 空闲 时 也 不 
会 停止 工作 。 该 调度 器 必须 用 合适 的 方式 调度 图 6. 10 所 示 的 示例 〈 如 果 有 调度 表 
存在 ， 那 么 调度 器 必须 依照 调度 表 进 行 调度 ) 。 

有 效 时 间 错过 的 死 线 











图 6. 10 需要 离开 处 理 器 闲置 状态 的 调度 器 


对 于 图 6. 10 所 示 的 示例 ,假设 有 两 个 给 定 的 任务 。 让 T, 作为 执行 时 间 为 2 的 
周期 任务 ,该 任务 的 周期 为 4， 并 且 死 线 的 间隔 也 为 4。7, 是 一 个 偶尔 运行 的 任 
务 ， 该 任务 在 4*n+1 时 可 执行 ,并 且 执 行 时 间 以 及 死 线 的 间隔 为 1。 假 设 7, 和 
T, 不 可 能 并 发 执行 (例如 ,使 用 了 一 个 单 处 理 器 ) ， 基 于 上 述 假设 ， 调 度 器 在 时 间 
点 0 开始 执行 任务 7 。 由 于 调度 器 不 允许 抢占 ， 因 此 在 时 间 点 1 时 ，7 没有 运行 ， 
因此 T, 也 会 漏 掉 它 的 死 线 。 如 果 调 度 器 在 处 理 器 空闲 时 停止 工作 ( 见 图 6. 10 在 时 
间 点 4) ， 那 么 一 个 规定 好 的 调度 器 开始 运行 ， 因 此 该 调度 器 不 是 最 优 的 。 最 优 的 
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调度 器 在 处 理 器 空闲 时 不 会 停止 工作 是 一 个 矛盾 的 假设 。 

推断 : 为 了 避免 丢失 死 线 ， 调 度 器 必须 知道 任务 的 调度 情况 。 如 果 调 度 器 对 任 
务 到 来 时 间 以 及 优先 级 一 无 所 知 ， 那 么 调度 算法 就 不 知道 是 否 保持 处 理 器 的 空闲 状 
态 还 是 运行 状态 。 可 以 得 知 ， 在 不 保持 处 理 器 空闲 状态 的 前 提 下 ，EDF 是 所 有 算 
法 中 的 最 优 算法 。 如 果 到 达 时 间 是 先 验 的 ， 调 度 问 题 就 成 为 了 使 用 非 确定 性 多 项 式 
以 及 分 支 及 边界 技术 生成 调度 表 。 


6.2.3 有 优先 级 约束 的 非 周期 性 调度 


6.2.3.1 最 近 死 线 优 先 算法 
下 面 通过 一 个 任务 图 来 反映 任务 间 的 依赖 关系 ( 见 图 6. 11) 。 任 务 T, 只 有 在 


7 以 及 T, 执行 完毕 ， 并 发 送信 号 给 区 
后 ， 方 可 执行 。 P 

图 6.11 也 显示 了 一 个 合法 的 调度 E) Ms | X 

yT i T i 





表 。 对 于 静态 调度 来 说 ， 该 调度 表 可 以 
存储 在 一 个 表格 中 ， 指 明 任 务 的 开始 以 
及 信息 交换 的 时 间 。 10 20 30 40 50 60 70 E 

Lawler [ Lawler, 1973] 提出 了 一 个 
能 够 同步 到 达 时 间 ， 以 实现 最 小 化 最 大 
延迟 的 最 优 算法 ， 该 算法 被 称 作 最 近 死 线 优 先 ( Latest Deadline First, LDF) 算法 。 
LDF 读 取 任 务 表 ， 并 向 队列 中 插入 没有 继承 者 的 任务 。LDF 接 下 来 重复 这 个 过 程 ， 
并 将 有 继承 者 的 任务 插入 该 队列 。 在 运行 时 ,任务 以 插入 队列 的 相反 顺序 执行 。 
LDF 算法 是 不 支持 抢占 的 单 处 理 器 下 的 最 优 算法 。 

可 以 用 改进 的 EDF 算法 处 理 异 步 到 达 任 务 下 的 情况 。 关 键 的 思路 是 从 一 组 给 
定 的 、 具 有 依赖 关系 的 任务 转变 为 一 组 有 不 同 的 、 时 间 参 数 的 、 不 相关 的 任务 
[ Chetto et al. ，1990] 。 该 算法 同样 是 单 处 理 器 系统 下 的 最 优 算法 。 

如 果 是 基于 非 抢占 的 情况 ， 也 可 以 使 用 Stankovic 以 及 Ramamritham [ Stankovic 
and Ramamritham, 1991 ] 提出 的 启发 式 算法 。 
6.2.3.2 最 快 调度 

有 些 致 力 于 编程 社区 也 提出 了 另外 的 调度 算法 ， 如 最 快 (As- Soon- As- Possi- 
ble, ASAP) 调度 、 最 晚 ( As- Late- As- Possible，ALAP) 调度 、 列 表 (List, LS) 
调度 ， 以 及 在 做 上 层 集成 〈High Level Synthesis, HLS) 社区 中 非常 流行 的 力 向 调 
度 (Force- Directed Scheduling，FDS) 算法 ( 见 [ Coussy and Morawiec, 2008] HLS 


1 





图 6.11 优先 图 以 及 调度 表 





最 近 成 果 ) ，ASAP 以 及 ALAP 调度 不 考虑 任何 资源 或 时 间 约 a b c 
Ro FDS 考虑 全 局 时 间 约束 ，LS 要 考虑 资源 约束 。 j : h 








下 面 将 用 一 个 简单 的 表达 式 来 证 明 前 三 种 算法 ， 考 虑 到 
一 个 3 x3 矩阵 ( 见 图 6. 12) 。 图 6.12 3x3 矩阵 
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该 矩阵 的 行列 式 det(4) 可 被 计算 为 
det(A) =a * (e*i-f*h) +b* (fx g-—d*i) +c%x (d*h-exg) 
该 计算 过 程 可 以 由 一 个 数据 流 图 表示 ( 见 图 6. 13) 。 假 设 每 个 算数 计算 都 代表 
了 一 个 简单 的 “任务 ”。 














图 6.13 行列 式 4 的 计算 


约定 所 有 的 矩阵 值 都 是 可 以 立即 使 用 的 〈 例 如 ， 这 些 值 都 存放 在 了 寄存 器 中 ) 。 

HLS 在 使 用 ASAP 时 ， 会 认为 任务 映射 为 一 个 起 始 时 间 @ > 0 的 整数 ， 因 此 调 
度 融 提 供 了 一 组 映射 : 

tT: VIN (6.3) 

XE G=(V, E) 是 数据 流 图 。 

对 于 ASAP 调度 ， 所 有 的 任务 都 尽 可 能 早 开始 运行 ， 算 法 工作 流程 如 下 : 

for (1=1; 所 有 任务 都 被 调度 ; 1++) { 

5={ 所 有 任务 的 所 有 输入 者 是 使 能 的 }; 

设置 所 有 任务 :的 起 始 时 间 为 s; 

} 

为 了 简单 起 见 ， 假 设 例子 中 所 有 加 法 以 及 减法 的 执行 时 间 都 为 1， 而 乘法 的 执 
行 时 间 为 2。 图 6. 14 显示 了 基于 示例 的 调度 器 的 数据 流 图 6. 13 的 结论 。 

在 ASAP 算法 的 第 一 轮 迭 代 过 程 中 ， 所 有 的 任务 都 不 基于 开始 时 间 设 置 为 1 的 
其 他 计算 。 在 第 二 轮 迭 代 过 程 中 ， 从 乘法 得 出 的 输入 还 是 不 可 用 的 。 在 第 三 轮 迄 代 
过 程 中 ,减法 在 时 刻 3 被 调度 。 该 过 程 直 到 最 终 的 加 法 在 时 刻 7 被 调度 后 方 可 终止 





O 每 一 个 整数 都 假定 与 同步 自动 机 的 时 钟 周 期 相对 应 。 
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t=4 














图 6.14 基于 图 6. 13 示例 的 ASAP 调度 


运行 。 

ASAP 调度 也 可 以 在 现实 中 应 用 : 它 意味 着 所 有 的 任务 都 要 尽 可 能 早 开 始 运 
47, 并 且 不 考虑 任何 资源 限制 。 
6.2.3.3 ALAP 调度 

ALAP 调度 是 第 二 个 简单 调度 算法 。 对 ALAP 调度 来 说 ， 所 有 的 任务 要 尽 可 能 
晚 运行 。 该 算法 工作 方式 如 下 ; 

for (t=0; 所 有 任务 都 被 调度 ;1- -) { 

S={ 所 有 任务 的 运行 都 不 需要 其 他 任务 的 依赖 关系 }; 

设置 所 有 任务 1 的 起 始 时 间 为 *- 其 执行 时 间 + 1; 

} 

添加 所 有 需要 的 起 始 时 间 的 时 间 戳 的 总 数 

该 算法 从 一 个 不 基于 其 他 任务 依赖 的 任务 开始 运行 ， 这 些 任务 假定 在 时 刻 0 时 
结束 运行 。 这 些 任 务 的 开始 运行 时 间 可 以 由 其 执行 时 间 运 算得 出 ， 并 随 着 时 间 的 变 
化 向 后 循环 迭代 运行 。 每 当 到 达 一 个 任务 最 述 结束 的 时 间 点 时 ， 一 个 新 的 任务 起 始 
时 间 被 计算 得 出 并 且 开 始 任 务 的 调度 。 当 循环 结束 后 ， 所 有 的 时 间 都 转 为 一 个 绝对 
时 间 ， 这 样 接 下 来 的 第 一 个 任务 又 在 时 刻 1 开始 运行 。 也 可 以 认为 ALAP 调度 是 
ASAP 调度 在 “其 他 ”图 的 结束 开始 运行 的 特例 。 

图 6. 15 显示 了 基于 图 6. 13 的 数据 流 图 的 调度 结果 。 

对 于 ALAP 调度 ，4 个 “任务 ”在 正确 的 时 间 单 元 后 运行 。 
6.2.3.4 LS 调度 

LS 调度 是 一 种 有 资源 限制 的 调度 技术 。 假 设 有 一 组 M 类 型 的 资源 ，LS 调度 在 
每 个 任务 都 只 有 在 握 有 某 种 特殊 类 型 资源 时 方 可 执行 。 表 调度 关心 每 个 me MM 类 型 
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图 6.15 使 用 图 6. 13 的 ALAP 调度 


EER B, 的 数量 。 

LS 调度 需要 获知 一 些 具 有 某 些 优先 级 的 、 可 用 的 、 可 以 反映 调度 紧急 性 的 特 
Kk MES” vev, G=(V, E) 信息 。 使 用 如 下 指标 度量 调度 紧急 性 [ Teich, 
1997]; 

1) 后 续 节 点 的 节点 数量 : 该 数量 为 在 树 中 当前 节点 下 的 节点 数量 。 

2) 路 径 长 度 : 节点 "sy 的 路 径 长 度 为 由 "开始 到 图 G 末尾 节点 的 路 径 长 度 。 
在 图 6. 16 中 ， 加 和 了 关于 路 径 长 度 的 相关 信息 。 路 径 长 度 通常 包含 有 与 这 些 执行 
节点 相关 的 执行 时 间 的 权 值 。 在 此 假设 执行 时 间 是 已 知 的。 














图 6. 16 ”基于 图 6. 13 的 路 径 长 度 
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3) 迁移 率 : 迁移 率 定义 为 ASAP 以 及 ALAP 调度 器 的 不 同 起 始 时 间 。 图 6. 17 
展示 了 对 应 示例 的 迁移 率 。 很 明显 ， 除 了 4 个 节点 外 ， 调 度 安排 有 非常 紧迫 的 压 


力 。 这 意味 着 所 有 的 节点 都 拥有 同样 的 优先 级 ， 并 且 通 过 迁移 率 只 可 以 了 解 到 所 要 
调度 任务 的 粗略 顺序 信息 。 



































图 6.17 基于 图 6. 13 的 迁移 率 示例 


LS 调度 需要 获知 欲 调度 的 图 C = (V，E) 的 相关 信息 。 对 每 个 m 的 上 界 B, 而 
， 图 中 每 个 节点 与 对 应 的 资源 me M 的 映射 反映 节点 ve 了 的 紧急 性 的 优先 级 函 
以 及 每 个 节点 ve 的 执行 时 间 。LS 调度 接 下 来 会 尝试 将 每 个 具有 最 大 优先 级 
的 节点 与 时 间 戳 相 匹配 ， 以 保证 不 违反 资源 约束 [ Teich, 1997]; 

for (1=0; 所 有 任务 都 被 调度 ; t++) { /循环 时 间 步 


Ol 


for (m € M) { /循环 资源 类 型 
Crm 二 一 组 在 时刻 还 始终 执行 的 加 类 型 任务 ; 


Arm 二 一 组 在 时刻 准备 开始 执行 的 m 类 型 任务 ; 
WES, C Aim 中 最 高 优先 级 的 任务 
ISi] + [Crm] < Bm. 
HEMA v E€ 5 的 开始 运行 时 间 为 t: (v) =t; 
}} 
图 6. 18 显示 了 基于 图 6. 13 的 示例 的 LS 调度 的 结果 。 
在 图 6. 13 中 ， 假 定 资源 限定 B, =3 用 于 乘法 与 乘 数 ， 并 且 B*'” =2 用 于 所 有 


其 他 的 “任务 ”"。 由 于 资源 限制 ，3 个 乘法 在 时 刻 3 运行 而 非 时 刻 1。 其 他 操作 的 
资源 限定 没有 任何 影响 。 请 牢记 乘法 需要 两 个 时 钟 步 长 。 
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t=9 


图 6.18 基于 图 6. 13 示例 的 LS 调度 的 结果 


6.2.3.5 FDS 
对 于 FDS [Paulin and Knight，1987] ， 假 设 给 定 了 时 间 限 制 ， 并 且 和 希望 找到 一 
个 有 资源 约束 的 调度 表 ， 以 最 大 限度 地 减 小 对 资源 的 需求 。FDS 单独 考虑 每 种 资源 
类 型 。 
FDS 从 一 个 能 够 反映 某 个 特定 操作 "在 某 一 时 刻 上 的 可 调度 的 “概率 ”P(v， 
t) 处 开始 运行 。 这 个 “概率 ”等 于 1 除 以 R(v) 的 大 小 。 这 里 的 有 RC(v) 指 的 是 一 
组 操作 可 能 开始 的 时 间 的 集合 : 
1 
Plad [TR peek? 
0 ,其 他 
式 中 R(v) 一 一 由 ASAP 调度 器 以 及 ALAP 调度 器 分 配 的 时 间 步 长 之 间 的 时 间 
间隔 。 
通过 这 个 “概率 ”， 可 以 计算 出 所 谓 的 能 够 反映 某 个 资源 m 在 控制 步 1 下 的 总 
体 资源 压力 的 “分 布 "。 这 个 “分 布 ” 仅 仅 是 对 所 有 资源 类 型 m 的 操作 的 可 能 | 
总 和 : 
D(t) = 3 Pl(v,t) 
veV 


图 6.19 显示 了 运行 示例 的 分 布 。 
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图 6. 19 基于 图 6. 13 的 分 配 示例 


例如 ， 对 于 时 间 约 束 8 而 言 ， 右 边 的 3 个 乘法 (不 在 关键 路 径 上 的 ) 有 两 个 
可 用 时 间 步 长 ， 其 可 用 的 概率 为 0.5。 由 于 在 关键 路 径 上 的 4 个 乘法 以 及 两 个 概率 
为 0.5 的 乘法 ， 其 分 布 D(1) 就 是 5。 

接 下 来 ，FDS 规定 “ 力 ”， 使 得 操作 〈 或 任务 ) 从 有 高 资源 压力 的 时 间 步 长 上 
移动 至 较 低 资源 压力 的 时 间 步 长 上 。 在 这 里 的 例子 中 ， 不 在 关键 路 径 上 的 乘法 的 起 
台 时 间 被 向 后 移动 ， 然 而 对 于 总 的 时 间 限 制 8 来 说 ， 由 于 乘法 假定 为 持续 两 个 时 间 
步 长 ， 这 并 不 能 降低 所 需 乘 数 的 数量 。 对 于 时 间 约 束 9 来 说 ， 相 比 于 ASAP 调度 的 
乘 数 ， 可 以 降低 乘 数 的 数量 。 有 关 FDS 的 更 多 细节 可 以 参考 [ Paulin and Knight, 
1987] 的 相关 论文 。 

FDS 有 着 若干 种 限制 。 例 如 ，FDS 依旧 基于 简单 资源 模型 ， 每 个 任务 只 能 被 映 
射 到 一 种 资源 上 。 

现在 ， 有 一 种 被 称 作 HLS 的 调度 技术 用 于 从 较 高 层次 看 待 系统 整体 的 调度 
行为 。 

HLS 技术 如 下 : 

1) 设计 用 于 要 考虑 的 “任务 ”之 间 的 依赖 关系 ; 

2) 设计 用 于 “多 处 理 器 ”的 调度 ; 

3) 通常 基于 简化 资源 (处理 器 ) 模型 (也 就 是 “任务 ”和 “处 理 器 ”之 间 
的 一 一 映射 ) ; 

4) 通常 使 用 穷 举 法 ， 并 且 不 保证 最 优 性 能 ; 

5) 速度 通常 比较 快 ; 

6) 几乎 从 不 使 用 周期 性 的 全 局 信息 等 ; 

7) 比 ASAP、ALAP 以 及 LS 在 控制 上 面 的 处 理 技术 更 加 先进 (循环 等 ) 。 


第 6 章 应 用 程序 映射 191 





6.2.4 没有 优先 级 约束 的 周期 调度 


6.2.4.1 注释 

接 下 来 ， 将 考虑 周期 性 任务 。 对 于 周期 性 调度 ， 考 虑 有 关 非 周期 性 调度 的 目标 
是 没有 意义 的 。 例 如 ， 当 讨论 一 个 有 关 无 限 循环 的 任务 时 ， 最 小 化 调度 表 的 总 长 度 
就 不 是 问题 ， 所 能 做 的 就 是 设 一 个 总 能 找到 存在 的 调度 表 的 算法 ， 这 促使 人 们 去 定 
义 最 优 的 周期 调度 表 。 
定义 : 对 于 周期 性 调度 ， 如 果 在 存在 可 用 调度 表 的 情况 下 ， 调 度 器 总 能 找到 存在 的 
调度 表 ， 那 么 这 个 调度 器 就 是 最 优 的 。 

假设 17,| 是 一 组 任务 。 任 务 T, 的 每 次 执行 被 称 作 一 次 作业 。 每 个 任务 的 每 
次 作业 假设 都 是 相同 的 ， 于 是 有 ( 见 图 6. 20) ; 

1) p; 是 任务 T, 的 周期 ; 

2) c 是 7 的 执行 时 间 ; 

3) d, 是 死 线 的 间隔 ， 换 言 之 ,就 是 7 的 一 








4) 4 是 任务 的 闲置 时 间 ， 定 义 为 
l=d, =& (6.4) 


WRL =0， 那 么 任务 T, 在 变 为 可 执行 状态 时 就 要 立刻 开始 执行 。 
Hu 表明 一 组 个 处 理 器 的 利用 率 ， 换 言 之 就 是 用 这 些 处 理 器 累积 的 执行 时 间 
除 以 它们 的 周期 : 
(6.5) 
假设 m 个 处 理 器 的 执行 时 间 是 相等 的 。 很 明显 ， 式 (6.6) 代表 了 调度 器 存在 
的 必要 条 件 : 
usm (6.6) 
在 系统 的 最 开始 ， 将 在 所 有 任务 都 是 独立 的 场景 限制 下 对 具体 的 执行 进行 
描述 。 
6.2.4.2 单调 速率 调度 算法 
单调 速率 (Rate Monotonic, RM) 调度 [Liu and Layland, 1973] 可 能 是 独立 
周期 处 理 中 ， 最 知名 的 调度 算法 。RM 调度 基于 如 下 假设 (“RM 假设 ”) ， 
1) 所 有 的 任务 都 有 一 个 周期 性 的 硬 死 线 ; 
2) 所 有 的 任务 都 是 独立 的 ; 
3) 对 于 所 有 任务 来 说 ，d =p,; 
4) ci 对 于 所 有 已 知 的 任务 来 说 是 常量 ; 
5) 上 下 文 切 换 所 需 的 时 间 是 微不足道 的 ; 
6) 对 于 单 处 理 器 以 及 nn 个 任务 来 说 ， 接 下 来 的 等 式 适 用 于 累积 利用 率 : 
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n=} <n(2" -1) (6.7) 
i=l i 


图 6.21 显示 了 式 (6.7) 右 侧 的 部 分 。 
右 侧 等 式 中 的 n 大 约 等 于 0.7. 

limn * (2'" —1) =log, (2) =In(2)( = ~0.7) (6.8) 

根据 单调 速率 调度 ， 任 务 的 优先 级 

是 随 着 任务 的 周期 单调 递减 的 。 换 句 话 


n (24/n)_4) 
A 

















说 ， 具 有 较 短 周期 的 任务 具有 较 高 优先 1 | oH FRR ee RR 
级 , 具有 较 长 周期 的 任务 的 优先 级 较 081 Ps, tape 
低 。RM 调度 是 基于 辕 定 优先 级 的 抢占 0 | | 
式 调度 策略 。 ee 

图 6. 22 所 示 是 由 RM 调度 器 生成 的 一 




















个 调度 示例 ， 任 务 T, 在 若干 时 刻 被 抢占 。 deen gle ee eee rae ley 
双向 箭头 用 于 指明 一 个 作业 的 开始 图 6.21 式 (6.7) 的 右 侧 部 分 

时 间 以 及 上 一 个 作业 的 死 线 。 任 务 1 ~3 的 周期 分 别 为 2、6 以 及 6。 执 行 时 间 分 别 为 

0.5、2 以 及 1.75。 任 务 1 有 着 最 短 的 周期 ， 因 此 ， 其 优先 级 最 高 。 每 当 任务 1 转 为 

运行 态 时 ， 其 作业 会 立即 抢占 当前 正在 运行 的 其 他 任务 。 任 务 2 与 任务 3 的 周期 相 

同 ， 所 以 这 两 个 任务 不 会 抢占 其 他 任务 。 
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图 6.22 由 RM 调度 器 生成 的 调度 示例 


式 (6.7) 要 求 处 理 器 要 保留 一 定 的 计算 能 力 ， 以 确保 对 所 有 的 请 求 都 能 进行 
及 时 响应 。 保 留 一 定 的 计算 上 限 的 原因 是 什么 呢 ?” 主 要 原因 就 是 RM 调度 器 ， 由 于 
该 调度 器 使 用 静态 优先 级 ， 这 就 导致 一 个 拥有 更 高 优先 级 ， 但 是 死 线 还 较 长 的 任务 
抢占 一 个 已 经 非常 接近 其 死 线 的 任务 。 这 样 优先 级 较 低 的 任务 就 会 丢掉 其 死 线 。 

图 6. 23 显示 了 一 个 没有 足够 的 可 用 时 间 保 证 RM 调度 器 的 调度 性 的 示例 。 一 
个 任务 的 周期 为 5， 并 且 执行 时 间 为 3， 第 二 个 任务 的 周期 为 8 ， 执 行 时 间 为 3。 
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图 6.23 RM 调度 器 在 时 刻 8 没有 满足 死 线 要 求 
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对 这 个 特殊 的 例子 ， 有 几 = +i 3, 等 于 0.975。2 * (22-1) 大 约 等 于 
0. 828。 因 此 ， 可 调度 性 不 能 满足 RM 调度 器 的 要 求 。 此 外 ， 实 际 上 在 时 刻 8， 死 
线 已 经 被 错过 。 假 定 错过 的 指令 会 在 下 个 周期 被 调度 。 

当 处理 器 的 利用 率 很 低 时 ， 丢 失 死 线 的 情况 不 会 发 生 ， 并 且 当 处 理 器 的 利用 率 
很 高 时 ， 就 会 发 生 丢失 死 线 的 情况 ， 如 图 6. 23 所 示 。 如 果 满 足 式 (6.7) 的 条 件 ， 
那么 系统 的 利用 率 就 会 保证 不 会 遇 到 图 6. 23 所 示 的 情况 。 式 (6.7) 是 充分 条 件 ， 
这 意味 着 有 可 能 找到 当 不 满足 上 述 条 件 时 的 调度 器 。 其 他 存在 的 充分 条 件 参 见 
[ Bini et al. , 2001], 

RM 调度 器 具有 如 下 重要 的 优点 : 

1) 在 多 处 理 咒 系统 上 验证 单调 速率 调度 的 最 优 性 是 可 行 的 。 

2) RM 调度 器 基于 静态 优先 级 。 这 就 给 了 基于 固定 优先 级 的 操作 系统 上 使 用 
RM 调度 的 机 会 ， 例 如 Windows NT 操作 系统 ( 见 Ramamritham [ Ramamritham et 
al. ，1998 | ，[ Ramamritham, 2002] ) 。 

3) 如 果 上 述 6 种 RM 假设 都 能 满足 ， 那 么 所 有 的 死 线 也 会 得 到 满足 ( 见 But- 
tazzo [ Buttazzo，2002 | 相关 著作 ) 。 

RM 调度 也 是 以 一 定数 量 形式 上 的 可 调度 性 证 明 作 为 基础 的 。 

处 理 器 并 不 是 总 需要 空闲 时 间 以 及 备用 产能 的 。 显 示 RM 调度 器 的 最 优 性 还 是 
可 能 的 ， 替 换 式 (6.7), A 





psi (6.9) 

所 有 任务 的 周期 应 该 是 拥有 更 高 优先 级 的 任务 的 倍数 。 例 如 ， 该 需求 要 求 ， 如 
采 某 个 任务 在 电视 机 中 运行 ,那么 其 执行 频率 应 该 是 25Hz、50Hz 以 及 100Hz。 

A (6.7) 以 及 式 (6.9) 提供 了 便捷 的 手段 去 检查 可 调度 性 的 状态 。 

如 果 RM 调度 有 若干 不 确定 的 状态 ， 那 么 可 以 很 方便 地 设计 某 些 示例 并 证 明 。 
定义 : 时 刻 上 被 称 作 是 任务 T, 的 瞬时 临界 时 间 ， 如 果 任 务 在 此 时 刻 变 为 运行 态 ， 那 
么 就 说 这 个 任务 的 响应 时 间 是 最 大 的 。 
论点 : 对 于 每 一 个 任务 7 ， 如 果 每 个 任务 T, 在 同一 时 刻 变 为 运行 态 并 有 最 高 优先 
级 ， 那 么 响应 时 间 就 是 最 大 的 。 

证 明 : 对 于 一 组 周期 任务 了 = (T, e T), As Vip, Sp +l ZEIMES T, 
以 及 任务 T, 的 高 优先 级 〈 见 图 6. 24) ， 随 着 任务 的 优先 级 变 高 ， 任 务工 的 响应 时 
间 也 会 增长 。 

WR T, 以 及 7 可 用 的 时 间 间 隔 降 低 ， 那 么 抢占 的 次 数 有 可 能 增多 ( 见 图 6. 25), 
例如 ， 图 6. 24 的 延迟 为 2c ， 图 6. 25 的 延迟 为 3c,。 

如 果 两 个 任务 在 同一 时 刻 都 变 为 可 运行 态 ， 则 高 优先 级 的 任务 对 低 优先 级 任务 
的 抢占 会 导致 响应 时 间 的 增加 。 

与 7, 与 7, 相关 的 任务 参数 可 以 在 其 他 成 对 出 现 的 任务 中 重复 使 用 。 因此 ， 如 
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果 其 他 高 优先 级 的 任务 同时 被 释放 ，7, 就 可 以 在 其 临界 时 间 到 来 的 瞬间 变 为 可 执 


行 态 。 
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图 6.24 被 高 优先 级 任务 T, 延迟 的 任务 7， 
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图 6.25 任务 T, 增加 的 延迟 


因此 ， 证 明 RM 调度 的 最 优 性 只 需要 考虑 当 拥有 高 优先 级 的 任务 同时 释放 时 的 
场景 。 
6.2.4.3 EDF 调度 
EDF 调度 也 适用 于 周期 性 任务 集 。 为 此 ， 可 以 考虑 定义 超 周期 的 相关 概念 用 
于 该 调度 集 。 
定义 : 超 周期 定义 为 单个 任务 周期 的 最 小 公 倍数 (least common multiple, lem) 。 
例如 ， 图 6. 23 示例 的 超 周期 为 40。 很 明显 ， 在 一 个 超 周期 内 就 足以 解决 调度 
问题 了 。 其 他 超 周期 也 可 以 使 用 该 调度 方案 。 该 调度 方案 基于 非 周期 性 的 EDF 调 
度 法 ， 适 用 于 单 超 周 期 并 解决 相应 的 调度 问题 。 由 于 没有 额外 的 约束 来 保证 必须 达 
到 最 优 性 ， 这 意味 着 在 当 凡 = 1 的 情况 下 ，EDF 调度 依旧 是 最 优 的 。 因 此 ， 当 
图 6.23 的 示例 使 用 EDF 调度 ( 见 图 6.26) 时 ， 不 会 发 生死 线 丢 失 的 情况 。 在 时 刻 5， 
EDF 的 行为 与 RM 调度 的 行为 是 不 同 的 ， 由 于 其 死 线 早 于 7,， 所 以 不 会 发 生 抢占 。 
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图 6. 26 ”基于 示例 6. 23 使 用 EDF 调度 生成 的 调度 表 











由 于 EDF 使 用 了 动态 优先 级 ， 所 以 该 调度 器 不 能 与 使 用 固定 优先 级 的 操作 系 
统一 起 使 用 。 然 而 ， 操 作 系统 可 以 通过 扩展 ， 在 应 用 层 模 拟 EDF 调度 策略 [Died- 
erichs et al. , 2008], 
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EDF 可 以 很 容易 就 扩展 为 处 理 不 同 周期 下 的 死 线 场景 中 。 
6.2.5 有 优先 约束 的 周期 调度 


调度 有 相互 依赖 的 任务 比 调度 相对 独立 的 任务 更 加 困难 。 问 题 的 关键 在 于 对 于 
给 定 的 一 组 有 依赖 关系 的 任务 以 及 给 定 的 死 线 ， 调 度 器 的 存在 与 否 取 决 于 非 完全 多 
项 式 [Garey and Johnson，1979 ] 。 为 了 减少 调度 工作 ,使 用 如 下 的 不 同 策略 : 

1) 添加 额外 的 资源 ， 使 得 调度 变 得 更 加 简单 。 

2) 将 调度 器 分 为 静态 以 及 动态 部 分 。 通 过 此 方法 ， 可 以 将 更 多 的 决策 放 在 设 
计时 ， 而 较 少 的 决策 放 在 运行 时 。 

很 明显 ， 也 可 以 尝试 使 用 基于 HLS 的 技术 用 于 周期 进程 。 


6.2.6 零散 事件 


可 以 将 零散 事件 组 合 为 中 断 ， 当 这 些 中 断 的 优先 级 在 系统 中 为 最 高 优先 级 时 ， 
立即 执行 。 然 而 ， 对 于 所 有 的 任务 来 说 ， 时 间 行 为 非常 难以 预测 。 因 此 ， 需 要 有 一 
个 特殊 的 零散 服务 任务 用 于 执行 定期 以 及 检查 准备 好 的 零散 任务 。 这 样 ， 零 散 任务 
本 质 上 就 可 以 转变 为 周期 任务 ， 从 而 提升 这 些 任 务 在 整个 系统 中 的 可 预测 性 。 


6.3 硬件 /软件 分 割 


6.3.1 简介 


根据 6. 1 节 描 述 的 问题 ， 应 用 映射 技术 必须 支持 对 异 构 处 理 器 的 映射 。 标 准 调 
度 技术 对 这 种 映射 的 支持 不 够 完善 。 然 而 ， 通 过 硬件 /软件 分 割 技术 ， 可 以 对 异 构 
处 理 器 映射 做 更 好 的 支持 。 因 此 ， 在 本 节 提 出 了 一 种 针对 该 技术 的 示例 。 

通过 硬件 /软件 分 割 ， 可 以 将 任 
务 图 的 节点 同时 映射 至 软件 及 硬件 
上 。 通 过 硬件 /软件 分 割 ， 可 以 决定 
哪个 部 分 必须 用 硬件 实现 ， 哪 个 部 分 
需要 用 软件 实现 。 对 嵌入 式 硬件 / 软 
件 分 割 的 标准 流程 设计 流 图 如 图 6. 27 
所 示 。 从 一 个 常用 的 表示 规范 开始 ， 
例如 任务 图 表 的 方式 以 及 平台 信息 的 
方式 。 图 6. 27 硬件 /软件 分 割 概貌 

对 于 任务 图 的 每 个 节点 ， 需 要 知 
道 所 需 工 作 量 以 及 使 用 这 些 节点 所 能 获得 的 收益 。 例 如 ， 执 行 时 间 必 须 可 预计 。 预 
测 通信 所 需 的 时 间 非 常 困难 ， 然 而 如 果 两 个 任务 需要 非常 高 的 通信 带宽 ， 那 么 将 这 
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两 个 任务 映射 到 相同 的 组 件 中 就 更 加 合适 。 许 多 情况 下 可 以 使 用 迭代 的 方法 。 对 于 
解决 分 割 问题 的 最 初 方 法 是 产生 、 分 析 并 改进 。 

一 些 分 割 的 方法 仅 限于 映射 任务 节点 到 特殊 用 途 的 硬件 或 运行 于 单 处 理 器 的 软 
件 上 。 这 些 分 割 可 以 用 对 分 算法 对 任务 图 进行 分 割 [ Kucheinski, 2002] 。 

也 有 更 多 复杂 的 算法 适用 于 对 多 处 理 器 系统 软 /硬件 的 分 割 。 接 下 来 将 描述 这 
些 算法 如 何 通过 标准 优化 技术 以 及 整数 线性 规划 进行 〈 见 附录 A) 分 割 ， 描 述 基 
于 一 个 优化 目的 的 设计 工具 COOL [Niemann，1998] 的 简单 版 本 。 


6.3.2 COOL 


对 于 CO00L， 输 入 包括 如 下 3 个 部 分 : 

1) 目标 技术 : COOL 的 这 部 分 输入 由 可 用 硬件 平台 模块 组 成 。COOL 支持 多 
处 理 右 系统 ， 但 需要 所 有 处 理 器 的 类 型 相同 ， 因 此 COOL 不 包含 自动 或 手动 进行 处 
理 需 选择。 使 用 的 处 理 器 类 型 (以 及 相应 的 编译 器 ) 必须 包含 在 COOL 的 这 部 分 
输入 中 。 至 于 与 某 些 硬件 有 关 的 应 用 程序 ， 根 据 所 有 需要 参数 自动 生成 的 硬件 信息 
必须 非常 充分 。 特 别 是 ， 有 关 这 些 技术 的 库 的 信息 必须 给 定 。 

2) 设计 约束 : 第 二 个 输入 部 分 由 例如 需求 效率 、 延 迟 、 最 大 内 存 大 小 或 最 大 
程序 制定 硬件 面积 组 成 。 

3) 行为 : 输入 的 第 三 部 分 描述 了 对 整体 行为 的 需求 。 分 层 任 务 图 用 来 描述 该 
需求 。 可 以 使 用 图 2. 6 所 示 的 任务 分 层 图 进行 相关 分 析 。 

COOL 使 用 两 种 边界 : 通信 边界 以 及 时 钟 边界 。 通 信 边 界 包含 交换 信息 数量 的 
相关 信息 ， 时 钟 边界 提供 了 时 钟 约束 。COOL 需要 了 人 解 分 层 图 中 每 个 叶 节 点 9 的 行 
为 ，COOL 预期 这 种 行为 可 以 用 VHDL 指明 ®。 

对 于 分 制 ，COOL 使 用 如 下 步骤 : 

1) 将 行为 转换 为 内 部 图 模型 。 

2) 将 每 个 节点 的 行为 由 VHDL 转化 为 C 。 

3) 将 所 有 的 C 程序 编译 为 选 定 的 目标 处 理 器 类 型 ， 计 算得 到 的 程序 大 小 ， 佑 
算 执行 时 间 。 如 果 用 后 者 进行 仿真 ， 那 么 仿真 的 输入 数据 必须 是 可 用 的 。 

4) 对 硬件 组 件 进行 合成 : 对 于 每 个 叶 节 点 ， 限 定 应 用 的 硬件 是 合成 的 。 因 此 
相当 数量 的 硬件 组 件 是 必须 进行 合成 的 ， 硬 件 的 合成 不 应 过 于 缓慢 。 用 于 商业 级 别 
的 合成 工具 专注 于 门 电路 级 别 的 合成 ， 对 于 COOL 来 说 过 于 缓慢 。 然 而 ， 高 级 别 合 
A (High-Level Synisters, HLS) 工具 可 以 工作 于 寄存 器 级 别 (使 用 地 址 、 寄 存 器 
以 及 多 路 转换 器 用 于 替换 门 电路 ) 提供 了 充足 的 合成 速度 。 此 外 ， 这 些 工具 可 以 








© W2.4.2.1 节 相关 定义 。 
”回顾 已 知 C 应 当 用 于 处 理 此 类 场景 ， 但 是 在 许多 标准 描述 中 ， 使 用 该 工具 相 比 于 C 而 言 更 加 简单 。 
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提供 足够 准确 的 值 用 于 时 延 以 及 所 需 的 硅 面积 。 在 实际 应 用 中 ， 通 常 使 用 高 级 别 合 
成 工具 OSCAR [ Landwehr and Marwedel , 1997], 

5) 扁平 的 分 层 结构 : 下 一 步 是 从 分 层 流 图 中 提取 扁平 任务 图 。 由 于 没有 对 节 
点 的 合并 或 拆 分 ， 就 需要 设计 者 进行 粒度 维护 。 耗 费 以 及 性 能 信息 可 以 从 添加 到 节 
点 中 的 编译 以 及 硬件 合成 中 获得 。 这 实际 是 COOL 的 一 个 核心 理念 : 硬件 /软件 分 
割 所 需 的 信息 可 以 预先 计算 ,并 且 具 有 良好 的 计算 精度 。 在 此 信息 上 形成 的 最 小 化 
成 本 设计 可 以 满足 设计 约束 。 

6) 生成 和 和 解决 优化 问题 的 数学 模型 COOL 使 用 整数 线性 规划 (Integer Linear 
Programming, ILP) 解决 优化 问题 。 商 用 的 ILP 程序 用 于 找到 决策 变量 的 值 ， 以 最 
小 化 系统 开支 。 解 决 方案 就 是 从 可 用 信息 中 获取 开支 函数 ， 并 进行 优化 。 然 而 ， 该 
开支 仅 包括 粗略 的 通信 时 间 的 近似 值 。 任 务 图 中 任意 两 个 节点 的 通信 时 间 取 决 于 这 
些 节 点 所 映射 的 处 理 器 以 及 硬件 。 如 果 这 两 个 节点 映射 到 了 同一 个 处 理 器 上， 那么 
通信 只 会 在 本 地 进行 ， 因 此 速度 可 以 非常 快 。 如 果 节 点 映射 到 了 不 同 的 硬件 模块， 
那么 异地 的 通信 速度 有 可 能 会 比较 慢 。 对 所 有 的 任务 图 的 节点 建立 所 有 可 能 的 映射 
模型 会 非常 复杂 ， 并 且 会 被 最 初 解决 方案 迁 代 的 改进 所 取代 。 更 多 有 关 步 又 的 细节 
将 会 在 下 面 进 行 描述 。 

7) 迁 代 的 改进 : 为 了 能 够 更 好 地 对 通信 时 间 进 行 估算 ， 可 以 将 相 邻 的 节点 合 
并 映射 到 相同 的 硬件 模块 中 。 该 合并 如 图 6. 28 所 示 。 


H, H, H, H, H, H, 
A A A A A A 
1 1 I 1 
Cun rece 
Q Da e 
C—C) © 
Z 1 
YA y 
P, P, 


图 6. 28 合并 任务 节点 并 映射 至 相同 的 硬件 模块 





假设 任务 T. T, 以 及 7; 映射 至 硬件 模块 HH 以 及 H, (ER T, 以 及 7, 映射 到 
AGHA P,。 这 样 ，7 与 T, 之 间 的 通信 就 是 局 部 通信 ， 因 此 合并 T, 以 及 7,， 并 且 
假设 这 两 个 任务 间 通 信 不 需要 通信 通道 ， 通 信 时 间 的 估算 精准 度 也 得 以 提高 。 结 论 
图 接 下 来 可 以 用 作 数 学 优化 时 的 新 输入 。 接 下 来 重复 类 似 的 步 又， 直至 所 有 的 任务 
图 节点 都 被 合并 。 

8) 接口 合成 : 在 分 市 后 ， 需 要 创建 用 于 连接 处 理 器 、 特 定 应 用 硬件 以 及 内 存 
的 粘 合 逻辑 。 

接 下 来 将 描述 如 何 使 用 0/1-ILP 模型 进行 分 割 建 模 〈 见 附录 A) 。 接 下 来 的 索 
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引 集 用 于 描述 ILP 模型 ; 

1) 索引 集 V 表 明了 任务 图 节点 ,每 个 eV 相当 于 一 个 任务 图 节点 。 

2) 索引 集 世 表明 了 任务 图 节点 的 类 型 。 每 个 !e 工 都 对 应 于 一 个 任务 图 节点 类 
型 。 例 如 ， 节 点 有 可 能 描述 平方 根 、 离 散 余弦 变换 (Discrete Cosine Transform, 
DCT) 或 离散 快速 傅 里 叶 变 换 (Discrete Fast fourier Transform, DFT) 计算 。 每 种 
计算 都 对 应 一 种 类 型 。 

3) 索引 集 必 指明 了 硬件 组 件 的 类 型 。 每 个 me M 都 与 一 个 硬件 组 件 类 型 相对 
应 。 例 如 ， 某 些 特殊 的 硬件 组 件 是 用 于 DCT 或 DFT。 那 么 就 有 一 个 索引 值 与 DCT 
硬件 组 件 对 应 ， 另 一 个 索引 值 与 DFT 组 件 对 应 。 

4) 对 于 每 个 硬件 组 件 ， 可 能 会 有 很 多 个 拷贝 或 者 说 “实例 ”。 每 个 实例 都 定 
义 为 索引 Je Jo 

5) 索引 集 KP 指明 处 理 器 。 每 个 ke KP 表明 了 一 个 处 理 器 〈 所 有 的 处 理 器 都 
是 同 种 类 型 ) 。 

模型 需要 如 下 的 决策 变量 : 

1) X, 2 如 果 节 点 v 映射 至 硬件 组 件 类 型 me M， 则 变量 值 为 1， 否 则 为 0。 

2) Vig: 如 果 节 点 映射 至 处 理 器 ke KP， 则 变量 值 为 1， 否 则 为 0。 

3) NY,;: 如 果 至 少 有 一 个 类 型 1 节点 映射 至 处 理 器 ke KP， 则 变量 值 为 1， 
否则 为 0。 

4) 任务 图 节点 与 其 对 应 类 型 的 映射 VoL RARE, 

就 特殊 情况 而 言 ， 成 本 函数 为 所 有 硬件 单元 的 成 本 的 累加 值 : 

C = 处 理 器 开支 + 存储 器 开支 + 特定 应 用 硬件 开支 

如 果 在 系统 设计 时 不 包括 处 理 器 、 存 储 器 以 及 特定 应 用 的 硬件 ， 那 么 就 可 以 明 
显 缩减 系统 总 开支 。 但 由 于 约束 因素 ， 这 并 不 能 成 为 一 个 合理 的 解决 方案 。 接 下 来 
描述 一 些 基 于 ILP 模型 的 约束 条 件 : 

1) 操作 分 配 约束 : 这 种 约束 保证 每 个 操作 的 实现 都 是 在 硬件 或 软件 中 完成 
的 。 对 应 的 约束 可 以 用 下 式 表示 : 

Voe VS Xt SY ol (6. 10) 


在 纯 文本 中 ， 这 意味 着 对 于 所 有 的 任务 图 节点 "， 必 须 保 证 o 或 者 在 硬件 中 实 
现 ( 对 于 某 些 m KH, KERA X, 。 中 的 变量 值 为 1) 或 者 在 软件 中 实现 (对 于 某 
Bek, 设置 某 个 了, 的 变量 值 为 1) 。 
所 有 的 变量 都 假设 为 非 负 整数 : 
X, „e IN, (6. 11) 
Y,, € IN, (6. 12) 
PINAR RUE RE et X,Y, FL 作为 上 界 ， 因 此 事实 上 是 一 个 0/1 值 
的 变量 : 
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VveV: YmeM:X, „<1 (6.13) 
VveV: VkeKP:Y,,<1 (6.14) 
如 果 某 功能 类 型 节点 ! 映射 至 某 处 理 器 上， 则 该 处 理 器 的 指令 存储 器 必须 包含 
该 功能 的 软件 拷贝 
VleL, Vv: Type(v) =c Vk e KP: NY,,>Y,, (6. 15) 
在 纯 文 本 中 ， 这 意味 着 对 于 所 有 的 任务 图 节点 类 型 1 以 及 所 有 的 该 类 型 节点 v, 
必须 保证 如 果 "” 映射 至 某 处 理 器 上 《有 对 ,=1) ， 那 么 处 理 器 大 必须 提供 与 功能 7 所 
对 应 的 软件 ， 并 且 对 应 的 软件 必须 在 该 处 理 器 上 是 已 存在 的 (有 NY,, =1) 。 
附加 约束 确保 决策 变量 NY, ,依然 是 一 个 0/1 值 变量 ; 
VleL: Vke KP: NY,, <1 (6. 16) 
2) 资源 约束 : 下 一 组 约束 确保 “不 会 有 太 多 ”的 节点 在 同一 时 间 映 射 至 同一 
便 件 组 件 中 。 假 设 对 于 每 个 时 钟 周期 ， 每 一 个 硬件 组 件 在 同一 时 刻 只 能 执行 种 操 
作 。 不 幸 的 是 ， 这 意味 着 分 割 算法 不 得 不 为 执行 任务 图 节点 生成 分 割 调度 器 。 对 于 
大 多 数 相关 问题 的 实例 ， 调 度 器 本 身 就 是 一 个 非 完 全 多 项 式 问题 。 
3) 优先 约束 ; 该 约束 确保 调用 于 执行 操作 的 调度 器 与 任务 图 中 的 优先 约束 








Be 
4) 设计 约束 : 该 约束 用 于 限制 某 些 硬件 组 件 的 成 本 ， 例 如 存储 器 、 处 理 器 或 
特定 应 用 硬件 的 面积 。 

5) 时 间 约束 : 如 果 时 间 约 束 出 现在 COOL 的 输入 中 ， 那 么 就 可 以 转化 为 ILP 
约束 。 

6) 还 有 某 些 不 太 重要 的 约束 没有 包含 在 上 述 列表 中 。 

示例 : 接 下 来 将 会 在 图 6. 29 中 展示 这 些 约束 是 如 何 从 任务 图 中 形成 的 (与 图 
2.6 中 一 致 ) 。 

假设 有 一 个 硬件 组 件 库 ， 包 含 组 件 类 型 为 轧 、 瓦 、 及 的 3 个 组 件 ， 每 个 组 件 
的 成 本 单元 分 别 为 20、25 和 30。 此 外 ， 假 设 还 有 一 个 成 本 为 5 的 处 理 器 已。 另外 ， 
假设 图 6. 30 的 表 描述 了 任务 在 这 些 组 件 下 的 执行 时 间 。 














图 6.29 任务 图 图 6.30 任务 T, ~T, 在 组 件 上 的 执行 时 间 


任务 T, ~T, 只 能 在 处 理 器 或 某 一 特定 应 用 硬件 单元 上 执行 。 很 明显 ， 这 里 假 
设 处 理 器 的 成 本 更 低 ， 并 且 在 执行 任务 7, 、7, 和 7, 时 更 慢 。 
必须 生成 下 列 操作 分 配 约束 ， 假 设 使 用 最 快 的 处 理 器 (P, ) : 
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X11 +, =1 (任务 1 映射 至 到 或 Pi) 
Xaa +Y, =1 (任务 2 BB H, X P) 
X33 +Y, =1 (任务 3 BRS H, a P,) 
Xia +Y, =1 (任务 4 映射 至 已 或 己 ) 
X5,+Y;,=1 (任务 5 映射 至 六 P) 
此 外 ， 假 设 任务 T, ~T, 的 类 型 分 别 为 1=1、2、3、3 以 及 1， 接 下 来 需要 额外 
的 资源 约束 : 


NY 2Y,, (6. 17) 
NY,,2Y,, 
NY, ,2Y;, 
NY, | =Y, 
NY, ,2=Y;, (6. 18) 


式 (6.17) 表明 : 如 果 任 务 1 映射 至 处 理 器 ， 那么 功能 1=1 必须 在 该 处 理 器 
上 实现 。 如 果 任 务 5 也 映射 至 该 处 理 器 ， 相 同 的 功能 也 必须 在 该 处 理 器 上 实现 。 

这 里 并 没有 包括 对 时 间 的 约束 。 很 明显 当 处 理 器 在 执行 某 些 任 务 和 有 低 于 100 
个 时 间 单 元 的 时 间 约 束 的 特定 功能 硬件 时 ， 速 度 较 慢 。 

成 本 函数 为 

C =20 * #(H,) +25 x #(H,) +30 * #(H,) +5 *#(P) 

这 里 #( ) 表明 了 硬件 组 件 的 实际 数量 。 如 果 将 调度 表 也 考虑 在 内 ， 该 数量 可 以 
通过 引入 的 变量 计算 得 出 。 对 于 有 100 个 时 间 单 元 的 时 间 约 束 ， 最 低 成 本 的 设计 包括 
组 件 H, H, 以 及 P。 这 意味 着 T 以 及 T, 通过 软件 实现 ， 而 其 余 的 通过 硬件 实现 。 

总 之 ， 由 于 对 分 区 的 组 合 以 及 调度 问题 的 复杂 性 ， 只 有 非常 小 的 组 合 问题 可 以 
在 运行 时 解决 。 因 此 关键 的 问题 是 要 将 问题 自我 分 割 为 调度 问题 及 分 割 问题 : 最 初 
的 分 割 基 于 执行 时 间 的 估算 以 及 分 割 后 最 终 的 调度 。 如 果 最 终 非 常 乐观 地 看 待 调 度 
表 ， 那 么 整个 任务 处 理 过 程 就 必须 使 用 更 加 严格 的 时 间 约 束 。 实 验 表 明 ， 自 我 进行 
成 本 解决 方案 仅仅 比 最 优化 的 成 本 有 着 1% 或 2% 的 成 本 增加 。 

自动 分 割 可 以 用 于 对 设计 空间 的 分 析 。 接 下 来 将 呈现 一 个 由 音乐 制作 室 得 出 的 
结论 ， 其 中 包括 了 混合 、 增 益 、 回 波 、 均 衡器 以 及 平衡 单元 。 该 示例 使 用 了 先前 的 
目标 技术 ， 以 证 明 分 割 的 效果 。 目 标 硬 件 由 SPARC 处 理 器 、 外 部 存储 器 以 及 特定 
应 用 硬件 组 成 ， 使 用 了 1pASIC (早期 的 ) 库 进行 设计 。 系 统 允许 的 最 大 延 时 设置 
为 22675ns， 与 用 于 CD 的 44. 1KHz 的 采样 率 相对 应 。 图 6. 31 显示 了 不 同 的 由 改变 
延迟 约束 所 得 的 设计 要 点 。 

单位 和 是 指 与 技术 相关 的 长 度 单位 。 它 本 质 上 是 芯片 上 两 条 金属 导线 中 心 最 
近 距 离 的 一 半 (也 称 作 间距 [ITRS Organization, ，2009 ] ) 。 与 左 侧 的 设计 点 对 应 的 
为 完全 使 用 硬件 实施 的 解决 方案 ， 右 侧 对 应 的 是 软件 的 解决 方案 。 其 他 的 设计 点 使 
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时 间 /ns 
图 6.31 音频 实验 的 设计 空间 


用 了 软 、 硬 件 混合 的 方案 。78. 4N? 的 面积 是 符合 最 便宜 的 要 求 的 死 线 。 
很 显然 ， 现 今 的 技术 已 经 发 展 到 允许 音频 实验 100% 用 软件 实现 ， 然 而 基于 该 
设计 方法 的 示例 也 可 应 用 于 更 加 苛刻 的 应 用 中 ,特别 是 高 速 多 媒体 领域 ， 例 如 


MPEC-4。 


64 ”映射 至 异 构 多 处 理 器 


目前 (2010 年 )， 异 构 多 处 理 器 的 映射 时 钟 是 一 个 研究 课题 。 欧洲 卓越 网 络 设 
计 公 司 (the Artist Design European Network of Excellence) 部 门 进行 了 应 用 映射 至 
MPSoC 的 研讨 会 ， 对 该 领域 的 国内 外 现状 进行 了 总 揽 。 接 下 来 讨论 的 内 容 不 但 基 
于 第 一 次 [Marwedel，2008a] 以 及 第 二 次 [Marwedel, 2009a] 研讨 会 ， 并 对 第 一 
期 研讨 会 的 内 容 作 了 摘要 的 总 找 [Marwedel，2009b] 。 对 该 映射 的 不 同方 法 可 以 分 
为 两 个 标准 : 映射 工具 可 以 假设 用 于 固定 的 执行 平台 或 者 可 以 在 映射 时 设计 这 样 _- 
个 平台 ， 该 平台 可 能 不 包括 自动 并 行 化 的 源 代码 。 图 6. 32 包括 了 使 用 这 两 种 标准 
的 一 些 可 用 的 映射 工具 的 分 类 。 
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图 6. 32 映射 工具 分 类 以 及 对 应 的 开发 者 
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源 于 苏黎世 联邦 理工 学 院 [Thiele，L. et al. ，2009] 的 DOL 工具 包括， 

1) 自动 选择 计算 模板 : 处 理 器 类 型 是 可 以 完全 异 构 的 。 标 准 处 理 嚣 、 微 控制 
ar, DSP, FPGA 等 ， 都 是 可 用 的 选项 。 

2) 自动 选择 通信 技术 : 各 种 可 行 的 互联 方案 ， 例 如 中 央 总 线 、 分 层 总 线 、 环 
形 总 线 等 。 

3) 自动 选择 调度 器 以 及 仲裁 方法 : DOL 工具 可 以 自动 在 EDF、TDMA 以 及 基 
于 优先 级 的 方案 中 进行 选择 。 

DOL 的 输入 由 一 组 任务 以 及 对 应 的 用 例 组 成 。 输 出 描述 了 执行 平台 、 任 务 在 
处 理 器 上 的 映射 以 及 任务 调度 器 。 输 出 预计 满足 约束 〈 例 如 存储 器 大 小 以 及 时 间 
AR) 以 及 对 目标 的 最 小 化 (例如 尺寸 、 功 耗 等 )。 应 用 程序 由 所 谓 的 问题 表 表 
AX. Al 6. 33 显示 了 一 个 DOL 问题 表 的 示例 ， 该 图 模拟 了 明确 的 通信 过 程 。 

此 外 ， 可 能 使 用 的 执行 平台 由 被 称 作 架 构图 的 图 表 来 表示 。 图 6. 34 展示 了 一 
个 简单 地 用 架构 图 表示 的 硬件 平台 。 同 样 ， 通 信 过 程 被 显示 地 建 模 。 
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rod) 
通信 节点 < eE 
s FNT RISC HWM1 
ZET PTP 总 线 共享 总 线 PTP 总 线 
HWM2 
HWM2 
图 6.33 DOL 问题 图 图 6.34 DOL 架构 图 


问题 图 以 及 架构 图 被 合并 为 规范 图 。 图 6. 35 显示 了 DOL 规范 图 。 

该 规范 图 包括 了 问题 图 以 及 架构 图 。 两 个 子 图 的 边界 代表 了 可 行 的 实现 。 总 的 
来 说 ， 实 现 由 一 个 三 元 组 表示 : 

1) 分 配 a : a 是 架构 图 的 一 个 子 集 ， 表 明了 硬件 组 件 在 特定 设计 下 的 分 配 
CEER) o 

2) REB: 规范 和 体系 结构 所 选择 的 子 集 的 边界 ， 表 明了 两 者 之 间 的 关系 。 
所 选择 的 边界 被 称 之 为 绑 定 。 

3) 调度 7 : 7 分 配 了 问题 图 中 每 个 节点 wv 的 开始 时 间 。 

示例 : 图 6.36 显示 了 如 何 将 图 6. 35 所 示 的 规格 说 明 书 转 化 为 一 个 实际 的 实现 。 

Æ DOL 中 ,具体 实现 始 于 进化 算法 一 起 生成 【Bick and Schwefel, 1993 |, 
[ Bäck et al. , 1997], [Coello et al. ，2007] 。 通 过 这 些 算法 ， 解 决 方案 由 独立 的 染 
色 体 字符 串 表示 。 使 用 进化 算法 ， 可 以 在 现 有 的 解决 方案 集合 中 生成 新 的 解决 方案 
的 集合 。 集 合 的 生成 基于 进化 操作 ， 例 如 突变 、 选 择 以 及 重组 。 在 解决 方案 的 新 集 
合 中 进行 选择 基于 适应 值 。 进 化 算法 能 够 解决 复杂 的 优化 问题 ， 并 且 不 像 其 他 类 型 
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的 算法 那样 僵化 。 在 染色 体 上 寻找 合适 的 编码 方案 并 不 是 件 容 易 的 事 。 一 方面 ， 解 
码 不 应 该 使 用 太 多 的 运行 时 间 ， 另 一 方面 ， 必 须 处 理 某 些 进化 后 的 情况 。 除 了 一 些 
精心 设计 的 编码 ， 这 些 进化 有 可 能 生成 不 可 行 解 。 


RISC 


HWM1 


PTP 总 线 





HWM2 





图 6.35 DOL 规范 图 图 6.36 DOL 实现 


在 DOL 中 ,染色 体 进行 分 配 和 绑 定 编码 。 为 了 对 菜 一 解决 方案 的 适应 值 进行 
评估 ， 分 配 以 及 绑 定 必须 分 别 解 码 ( 见 图 6. 37)。 
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图 6. 37 单个 染色 体 的 解码 解决 方案 


在 DOL 中， 染色体 并 没有 对 调度 表 进 行 编码 ， 反 之 调度 表 是 从 分 配 及 绑 定 中 
获得 的 。 这 种 方法 避免 了 对 调度 决策 的 进化 算法 进行 重 载 。 一 旦 对 调度 表 进行 计 
算 ， 那么 就 可 以 对 解决 方案 的 适应 度 进行 评估 。 

DOL 的 总 体 架 构 如 图 6. 38 所 示 。 














系统 架构 
性 能 值 
I = SPEA2 
勘察 周期 -> 
选择 “好 ”架构 


图 6.38 DOL 工具 
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在 最 开始 ， 任 务 图 、 用 例 以 及 可 用 的 资源 都 是 已 定义 的 。 这 些 用 例 以 及 资源 都 
可 以 通过 一 个 被 称 作 MOSES 的 特殊 编辑 器 编辑 。 这 些 初始 信息 可 以 通过 一 个 评估 
框架 EXPO 进行 评估 。 可 以 通过 EXPO 计算 出 效率 值 ， 并 发 送 至 SPEA2，SPEA2 是 
一 个 基于 进化 算法 的 优化 架构 。SPEA2 选择 好 适合 的 候选 架构 ， 并 将 架构 送 回 EX- 
PO 进行 评估 。 评 佑 结果 会 再 次 送 入 SPEA2 中 ， 进 行 下 一 轮 的 进化 优化 。 这 种 在 
EXPO 以 及 SPEA2 的 乒乓 过 程 ， 直 到 发 现 优良 的 解决 方案 后 方 会 停止 。 选 择 的 解决 
方案 基于 帕 累 托 最 优 原 则 。 一 组 帕 累 托 最 优 设计 会 返回 给 设计 者 ， 设 计 者 会 在 不 同 
目标 之 间 进 行 分 析 及 权衡 。 图 6. 39 显示 了 基于 帕 累 托 的 可 视 化 结论 。 
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图 6. 39 使 用 帕 累 托 最 优 原 则 解决 相关 设计 问题 的 一 个 方案 @ ETHZ 


SystemCodesigner [Keinert et al. , 2009] 的 功能 与 DOL 有 些 类 似 。 然 而 ， 在 规 
格 的 描述 (可 以 用 SystemC) 以 及 优化 的 执行 上 ,与 DOL 有 所 不 同 。 应 用 程序 的 
映射 可 以 被 仿真 为 ILP 模型 。 通 过 使 用 ILP 优化 器 ， 可 以 产生 第 一 个 解决 方案 。 该 
解决 方案 可 以 通过 切换 至 进化 算法 获得 提升 2 。 




















加” 较 新 的 版 本 使 用 可 满足 性 (SAT) 解决 同样 的 目标 。 
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Daedalus [ Nikolov et al. , 2008] 包含 了 自 动 并 行 处 理 。 为 了 该 目的 ， 一 系列 
的 应 用 被 映射 至 Kahn 处 理 器 网 络 中 。 通 过 Kahn 处 理 器 网 络 作 为 中 间 表 示 层 ， 设 
计 空 间 的 探寻 可 以 被 继续 执行 。 

其 他 方法 从 给 定 的 任务 图 以 及 到 固定 架构 的 映射 开始 进行 。 例 如 ，Ruggiero 可 
以 将 应 用 程序 映射 至 Cell 处 理 器 [Ruggiero and Benini，2008]。 通 过 使 用 Ptolemy 
工具 提供 的 计算 模型 ，HOPES 系统 能 够 映射 至 多 种 处 理 器 上 [ Ha，2007]。 有 些 
工具 还 将 其 他 的 目标 也 考虑 在 内 ， 例 如 Xu 考虑 了 可 以 对 目标 系统 进行 可 靠 性 方面 
的 优化 [Xu et al. , 2009], Simunic 在 她 的 工作 中 包含 了 热 分 析 ， 并 且 尝 试 在 MP- 
SoC 上 避免 出 现 热 点 [ Simunic- Rosing et al. , 2007], Popovici 等 人 将 该 工作 进行 了 
进一步 发 展 [ Popovici et al. ，2010 ] 。 通 过 使 用 Simulink 以 及 SystemC 语言 ， 可 以 
在 和 若干 级 别 进行 仿真 。 

用 于 固定 架构 的 自动 并 行 化 方法 包括 在 爱丁堡 大 学 使 用 的 [Franke and 0’ 
Boyle，2005 | Mnemee 工具 集合 [ Mnemee project, 2010], MAPS 工具 [Ceng et 
al. , 2008] 将 DSE 与 自动 并 行 化 进行 了 结合 。 








65 思考 题 


L 假设 有 一 组 4 个 任务 。 到 达 时 间 为 4;,， 死 线 为 d;,， 执 行 时 间 为 < ， 详 情 
如 下 : 

1) T,:A,=10, d =18, c =4 

2) T,:4,=0, d, =28, c, =12 

3) T;:A,=6, d,=17, c, =3 

4) T,:A,=3, d,=13, ¢, =6 

使 用 最 早死 线 到 达 (Earliest Deadline First, EDF) 以 及 最 小 余 度 (Least Laxi- 
ty, LL) 调度 法 进行 任务 调度 ， 生 成 与 该 任务 组 对 应 的 调度 图 ! 对 于 LL 调度 ， 指 
出 所 有 任务 在 上 下 文 切换 时 的 最 小 余 度 ， 会 有 任务 错过 其 死 线 吗 ? 

2. 假设 有 一 组 6 个 任务 T, ~ 四， 其 执行 时 间 及 死 线 如 下 : 

1) Ti:d) =15, c =3 


2) Bid, =13, c =5 
3) Ty:d,=14, c,=4 
4) Ted, =16，c =2 
5) T;: d; =20, c, =4 
6) T: d, =22，c =3 


任务 的 依赖 性 如 图 6. 40 所 示 。 任 务 T, 以 及 T, 是 立即 可 用 的 。 
在 使 用 LDF 算法 的 情况 下 ， 生 成 基于 该 任务 组 的 调度 图 。 
3. 假设 有 一 个 包含 两 个 任务 的 系统 。 任 务 1 的 周期 为 5， 执 行 时 间 为 2。 任 务 





206 谋 入 式 系 统 设计 一 一 嵌入 式 信 息 物 理 系 统 基础 ( 原 书 第 2 版 ) 














图 6.40 任务 依赖 


2 的 周期 为 7 执行 时 间 为 4。 让 死 线 与 任务 周期 相同 。 假 设 使 用 RMS， 在 处 理 器 使 
用 率 过 高 的 情况 下 ， 这 两 个 任务 是 否 会 错过 其 死 线 ? 计算 其 利用 率 ， 并 在 保证 其 调 
度 性 边界 的 情况 下 进行 比较 ! 假设 这 两 个 任务 即使 在 错过 其 死 线 也 能 运行 完毕 的 情 
况 下 ， 画 出 基于 该 调度 系统 的 调度 图 表 。 

4. 考虑 和 思考 题 3. 同样 的 调度 情况 下 ， 使 用 EDF 是 否 会 有 任务 错过 其 死 线 ? 
如 果 没 有 ， 为 什么 ? 假设 任务 总 能 够 运行 完毕 ， 画 出 基于 此 种 调度 算法 的 调度 图 。 

5. 考虑 一 组 任务 。 让 了 = {v| 为 该 组 任务 的 索引 。L = {1} 为 任务 类 型 ， 并 且 
类 型 : VoL AEF BRA. BEM = |m} 以 及 KP = 1 分 别 表示 为 硬件 
组 件 以 及 处 理 器 。 使 用 COOL 描述 下 列 硬 件 / 软 件 模型 分 割 ; 

1) 需要 使 用 哪些 决策 变量 ? 

2) 任务 类 型 为 ! 的 变量 模型 是 否 被 映射 到 了 处 理 器 上 上。 

3) 目标 函数 应 为 何 种 运行 方式 ? 

4) 哪些 等 式 用 来 确保 每 个 任务 能 够 在 硬件 及 软件 上 实施 。 

5) 如 果 说 该 类 型 的 任务 可 以 运行 在 该 处 理 器 上 ， 哪 些 等 式 用 来 确保 该 任务 映 
射 到 该 处 理 器 中 ? 


第 7 章 优 化 
为 了 让 嵌入 式 系统 尽 可 能 满足 性 能 需求 ， 大 量 的 性 能 优化 方法 被 提出 并 不 断 发 
展 。 本 书 所 能 提 及 的 只 是 这 些 算法 的 一 个 小 子 集 。 在 本 章 ， 将 提出 一 些 可 选择 使 用 


的 优化 方法 。 在 设计 流 图 中 ， 如 第 6 章 以 及 图 7. 1 所 示 ， 这 些 优化 方法 被 当 作 应 用 
程序 到 最 终 系统 映射 的 补充 工具 。 


规格 说 明 书 
aR HW 子 系统 


系统 软件 (RTOS、…) 


















应 用 筹划 
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评估 与 批准 


图 7.1 本 章 所 处 的 上 下 文 环境 


7.1 任务 级 并 发 性 管理 


如 在 2. 2 节 所 提 及 的 ， 任 务 图 的 粒度 是 其 最 重要 的 属性 。 即 使 对 于 分 层 的 任务 
图 而 言 ， 改 变 其 节点 的 粒度 也 是 有 必要 的 。 对 于 旨 在 最 大 效率 提升 性 能 的 目的 ， 不 
一 定 要 将 系统 规格 说 明 书 中 的 需求 分 割 至 任务 或 处 理 器 中 。 当 然 ， 在 规格 阶段 ， 清 
晰 的 结构 划分 以 及 干练 的 软件 模型 比 更 多 的 关心 系统 的 实现 更 有 意义 。 例 如 ，_ 个 
清晰 的 结构 划分 包括 了 对 使 用 的 抽象 数据 类 型 的 清晰 划分 。 此 外 ， 有 可 能 在 系统 需 
求 中 设计 流水 线 ， 将 若干 任务 在 一 条 流水 线 中 实现 ， 以 减少 上 下 文 切换 时 的 开销 。 
因此 ， 在 系统 实现 时 将 任务 与 设计 书 进行 一 一 对 应 是 不 必要 的 ， 这 意味 着 将 任务 进 
行 重组 是 明智 的 。 将 任务 重组 ， 进 行 合并 或 分 割 是 确实 可 行 的 。 

每 当 任务 T, 是 任务 T 的 直接 前 驱 ， 并 且 T, 没有 其 他 任何 直接 前 驱 任务 时 ( 见 
图 7.2,7;=7T 并 且 7=7,) 就 可 以 进行 任务 图 的 合并 。 如 果 这 些 任务 节点 是 通过 
软件 实现 的 ， 通 常 来 说 ， 这 种 转变 可 以 降低 上 下 文 切换 的 开销 ， 并 且 为 系统 优化 提 
供 更 多 的 潜能 。 

为 一 方面 ， 进 行 任务 分 割 有 如 下 益处 : 

当 任务 在 等 待 某 些 输入 时 ， 可 以 始终 持 有 某 些 资源 〈 例 如 大 量 的 内 存 ) 。 为 了 
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图 7.2 任务 的 合并 





最 大 限度 利用 这 些 资源 ， 在 这 些 资源 实际 需要 之 前 ， 可 以 有 限制 地 使 用 这 些 资源 。 
在 图 7.3 中 ， 假 设 任务 T, 代码 的 某 处 等 待 某 种 输入 。 


(© O 
Pp gh 
oo” ~ Foo” 


在 最 初 ， 任 务 T, 只 有 在 有 输入 时 方 可 运行 。 可 以 将 其 分 市 为 两 个 节点 77 以 
及 7，”， 实 际 需 要 输入 方 能 运行 的 部 分 是 TS, MET 可 以 更 早 运行 ， 这 样 可 以 
让 调度 更 加 灵活 。 这 种 分 割 可 以 提高 资源 的 利用 性 ， 并 且 可 以 保证 任务 的 运行 不 超 
过 其 死 线 时 间 。 这 种 分 割 还 会 对 数据 存储 所 需 的 内 存 产生 影响 ， 因 为 TT 可 以 在 结 
束 运行 前 不 久 释放 某 些 内 存 ， 并 且 77” 等 待 输入 时 可 以 将 这 些 内 存 分 配给 其 他 任务 
使 用 。 

有 可 能 导致 争论 的 地 方 是 任务 在 等 待 输入 之 前 就 应 当 将 所 持 有 的 资源 ， 例 如 大 
量 的 内 存 释 放 。 然 而 ， 由 于 系统 规格 书 的 可 读 性 ， 在 设计 阶段 的 早期 难以 协调 此 类 
实现 问题 。 

对 于 复杂 的 系统 规范 的 转化 可 以 通过 Cortadella 等 人 [ Cortadella et al. , 2000 | 
所 描述 的 基于 Petri 网 的 技术 实现 。 这 种 技术 由 使 用 FlowC 的 语言 所 描述 的 一 组 任 
务 开始 进行 。FlowC 语言 对 C 语 进行 了 进程 头 以 及 针对 于 进程 间 通 信 规 范 ， 例 如 
READ 以 及 WRITE 函数 调用 的 扩展 。 图 7.4 显示 了 使 用 FlowC 的 系统 规范 的 输入 。 

示例 中 使 用 输入 端口 IN 以 及 COEF, ， 输 出 端口 为 OUT。 点 对 点 的 进程 间 通 信 
通过 一 个 单 向 的 缓冲 通道 DATA 实现 。 任 务 GetData 从 外 部 读 取 数 据 并 且 将 其 发 送 
至 通道 DATA, BAKA N 个 样本 被 发 送 ， 其 平均 值 也 通过 同一 个 通道 发 送 。 任 务 
Filter 从 通道 中 读 取 N 的 值 (并 忽略 其 内 容 ) ， 并 读 取 其 平均 值 ， 然 后 将 平均 值 乘 
以 c (c 可 以 通过 COEF 端口 读 取 ) ， 最 终 将 所 得 出 的 结果 写 至 OUT 端口 中 。READ 
以 及 WRITE 调用 的 第 三 个 参数 是 要 读 和 写 的 数据 的 数量 。READ 调用 是 阻塞 调用 ， 
如 果 通 道上 的 数据 数量 超过 了 预先 定义 的 冰 值 ，WRITE 调用 也 会 被 阻塞 。 

SELECT 的 语法 结构 与 ADA 是 相同 的 : 知道 某 个 输入 到 达 端 口 时 ， 被 阻塞 的 
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输入 中 COEF e 输出 

















PROCESS GetData PROCESS Filter(InPort DATA, 
(InPort IN, OutPort DATA){ InPort COEF, OutPort OUT){ 
float sample,sum; int i; float c,d; int j; 
while (1) { c=1; j=0; 
sum=0; while(1) { 
for (i=0; i<N; i++){ DATA SELECT(DATA,COEF){ 
READ(IN,sample, 1) =O= case DATA: READ (DATA,d,1); 
sum+=sample; if (j==N){j=0; d=d*c; WRITE(OUT,d, 1); 
WRITE(DATA,sample, 1) } else j++; 
} break; 
WRITE(DATA,sumIN, 1); case COEF: READ(COEF,c,1); break; 
} W 














图 7.4 系统 规格 说 明 


任务 才 可 执行 。 这 个 示例 符合 所 有 在 图 7. 3 中 所 提 及 的 任务 分 割 的 标准 ， 这 两 个 任 
务 将 会 在 等 待 输入 的 同时 占用 资源 。 可 以 通过 对 这 些 任务 的 重组 提升 效率 ， 然 而 仅 
仅 对 图 7. 3 进行 简单 的 分 割 是 不 够 的 。Cortadella 等 人 提出 了 一 个 更 全 面 的 技术 ， 
通过 使 用 该 技术 ，FlowC 程序 首先 会 被 转化 成 (扩展) Petri 网 。 每 个 任务 的 Petri 
网 会 被 合并 至 一 个 Petri 网 中 。 通 过 Petri 网 ， 就 可 以 生成 一 个 新 的 任务 。 图 7.5 显 


示 了 一 个 可 用 的 新 任务 结构 。 
mt nm 


Tin(){ 
READ(IN,sample, 1); 
sum+=sample; i++; 
DATA=sample; d=DATA; 
if (==N) {j=0; d=d*c; WRITE(OUT,d, 1); 





Init(){ 
sum=0;i=0;c=1 ;j=0; 
} 














}else j++; 
LO: if (i<N) return; 
COEF © DATA=sum/N; d=DATA; 
if (==N) {j=0; d=d*c; WRITE(OUT,d,1); 
Tcoef(){ }else j++; 


READ(COEF,c,1); sum=0; i=0; goto LO 
} | 


图 7.5 生成 软件 任务 














在 该 新 任务 结构 中 ， 有 一 个 任务 会 负责 所 有 的 初始 化 工作 : 此 外 ， 还 会 有 一 个 
任务 用 于 所 有 的 输入 端口 。 该 实现 将 会 提升 每 个 端口 收 到 新 输入 后 的 中 断 效 率 。 每 


a 
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个 端口 都 应 该 有 一 个 属于 该 端口 的 中 断 ， 任 务 可 以 直接 通过 这 些 中 断 运行 ， 对 于 这 
些 任 务 而 言 ， 也 没有 使 用 操作 系统 的 必要 。 可 以 使 用 一 个 全 局 变量 (假设 对 于 所 
有 任务 而 言 都 可 以 访问 该 地 址 ) 用 于 进程 间 通 信 ， 这 样 整个 操作 系统 的 开销 将 会 
非常 低 。 
图 7. 5 所 示 的 是 基于 Petri 网 所 生成 的 任务 间 优 化 的 任务 代码 Tin。 如 果 该 测试 
用 例 在 第 一 次 执行 时 ， 其 状态 经 常 是 假 〈 在 此 情况 下 7 等于; -1， 并 且 无 论 ; 是 否 
STN, 1 与] 都 被 复位 为 0) ， 那 么 该 任务 再 次 通过 任务 内 部 的 优化 进行 优化 调整 。 
对 于 第 三 条 站 语句 ， 由 于 该 判断 点 仅仅 进行 i 是否 等 于 VN， 并 且 无 论 是 否 执行 至 10 
的 标号 ,i 都 等 于 j}， 所 以 其 结果 一 般 都 为 真 。 此 外 ， 变 量 的 数量 也 可 以 减少 。 下 面 
为 对 Tin 优化 后 的 代码 : 
Tin () { 
READ (IN, sample, 1); 
sum += sample; i++; 
DATA = sample; d = DATA; 
LO: if (i < N) return; 
DATA = sum/N; d = DATA; 
d= d*c; WRITE(OUTd,1); 
sum = 0; i=0; 
return; 
} 
设计 良好 的 编译 器 可 以 生成 Tin 的 优化 版 本 。 不 幸 的 是 ， 直 到 现在 也 几乎 没有 
哪个 编译 器 可 以 进行 这 种 优化 。 然 而 ， 该 示例 显示 了 类 型 的 转化 需要 生成 “好 ” 
的 任务 结构 。 有 关 更 多 的 任务 生成 的 细节 ， 可 以 参考 Cortadella 等 人 所 著 书 籍 
[ Cortadella et al. , 2000], 
在 Thoen [Thoen and Catthoor, 2000] 以 及 Meijer 等 人 [ Meijer et al. , 2010 ] 
的 相关 著作 中 ， 有 与 本 章 所 述 的 优化 相关 的 类 似 描述 。 


7.2 上 层 优化 
有 许多 对 系统 上 层 进行 优化 的 方法 可 以 提升 艇 入 式 系统 的 效率 。 


7.2.1 浮 点 至 定点 转换 


浮 点 至 定点 转换 是 一 种 常用 技术 ， 这 种 转换 的 原因 基于 许多 信和 号 处 理 标准 
(例如 MPEG-2 或 MPEG-4) 指定 了 在 C 程序 中 使 用 浮 点 数据 类 型 ， 这 使 得 程序 开 
发 者 尝试 找 出 基于 这 些 标准 更 有 效率 的 实现 方法 。 
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在 许多 信号 处 理 程序 中 使 用 定点 数 替 换 浮 点 数 是 可 行 的 ， 所 能 获得 的 收益 也 有 
可 能 是 巨大 的 。 例 如 ， 对 于 MPEG-2 视频 压缩 算法 [ Hüls, 2002] 而 言 ， 使 用 该 
方法 可 以 降低 75% 的 循环 次 数 以 及 76% 的 系统 功 耗 ， 然 而 效率 的 提升 会 导致 某 些 
精度 降低 。 更 准确 地 说 ， 开发 者 需要 在 系统 开销 以 及 算法 质量 中 进行 权衡 [ 例如 ， 
对 信 噪 比 (SNR) 的 评估 ] 。 对 于 小 字 长 系统 ， 算法 质量 有 可 能 影响 更 甚 。 因 此 ， 
尽管 可 以 使 用 定点 数 类 型 替换 浮 点 数 类 型 ， 但 是 精确 度 的 丧失 需要 提前 进行 分 析 。 
这 种 数据 的 替换 最 初 使 用 人 工 手 动 替换 ， 然而 这 种 替换 方式 有 可 能 非常 单调 并 容易 
导致 错误 的 产生 。 

因此 ， 有 相应 的 研究 者 试图 研发 出 某 种 可 以 进行 自动 替换 的 工具 ，FRIDGE 
[ Willems et al. , 1997], [Keding et al. , 1998] 是 其 中 的 一 种 。FRIDGE 是 Synop- 
sys CoCentric 工具 包 [ Synopsys, 2010 ] 的 一 个 商用 组 件 。 

在 FRIDGE 中 ， 设 计 过 程 从 一 个 包含 浮 点 数 的 C 算法 开始 进行 。 该 算法 会 被 转 
化 成 用 Fixed- C 描述 的 算法 。Fixed- C 使 用 C+ + 的 某 些 特性 对 C 进行 了 两 种 定点 
数据 类 型 的 扩展 。 定点 数据 类 型 的 声明 与 其 他 变量 的 声明 类 似 。 下 面 的 声明 分 别 进 
行 了 变量 、 指 针 以 及 数组 的 定点 数据 类 型 定义 

fixed a, * b,c[8 ] 

有 参数 的 顶点 数据 类 型 可 以 到 数据 使 用 时 再 进行 存储 空间 分 配 (但 不 是 必须 

如 此 ): 
a =fixed(5,4,s,wt, *b) 


的 FRIDGE 使 用 SystemC 顶点 数据 类 型 表示 生成 的 数据 类 型 信息 ， 因 此 SystemC 可 
以 用 于 进行 定点 数据 类 型 的 仿真 。 

Shi 和 Brodersen [ Shi and Brodersen, 2003], ， 此 外 还 有 Menard 等 人 [Menard 
and Sentieys, 2002] 提出 了 一 种 在 额外 的 噪声 以 及 字 长 之 间 进 行 权衡 的 分 析 方法 。 


7.2.2 简单 循环 转换 
有 很 多 种 循环 转换 的 方法 可 以 用 于 系统 架构 设计 ， 下 面 为 一 些 进 行 循环 转换 的 
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标准 : 
1) 循环 置换 : 考虑 一 个 二 维 数组 。 在 C 标准 中 人 
[ Kernighan and Ritchie, 1988 ] ， 二 维 数组 在 内 存 中 的 j=0 k=1 
分 配 如 图 7.6 所 示 。 相 邻 索引 值 的 第 二 个 索引 被 映射 hice 
至 了 一 块 连续 的 存储 空间 上 。 这 种 分 配方 式 被 称 作 行 ae a 
主 序 [ Muchnick ，1997 ] 。 但 要 注意 ,在 FORTRAN 中 ， ”人 [k=0 
数组 的 布局 与 C 语言 是 不 同 的 ， 相 邻 值 的 第 一 个 索引 cae =1 
被 映射 到 连续 的 存储 空间 ( 列 主 序 ) 。 有 些 描 述 FROT- | 


RAN 优化 的 相关 文章 在 此 处 有 可 能 导致 读者 发 生 某 些 ”图 7 6 (语言 中 一 维 数组 

混淆 。 P (i) Ci] 中 的 内 存 布 局 
对 于 行 主 序 ， 最 后 的 索引 与 最 内 部 的 循环 相对 应 

的 循环 组 织 方法 通常 来 说 对 系统 效率 提升 是 有 帮助 的 。 下 面 的 示例 显示 了 一 个 相应 


的 循环 置换 方法 : 
for (k=0; k<=m; k++) for (j=0; j<=n; j++) 
for (j=0; j<=n; j++) = for (k=0; k<=m; k++) 
pU][k] = … pilik] = .… 


这 种 排列 有 可 能 会 对 高 速 缓存 中 的 数组 元 素 重 用 产生 积极 影响 ， 因 此 接 下 来 迭 
代 的 循环 体会 访问 相 邻 的 存储 区 域 。 高 速 缓存 通常 会 对 这 些 相 邻 的 区 域 进 行 管理 ， 
以 大 大 增强 其 访问 效率 。 

2) 循环 融合 、 循 环 裂变 : 在 某 些 情况 下 ， 需 要 将 两 个 独立 的 循环 进行 合并 ， 
并 且 在 某 些 情况 下 需要 将 单独 的 循环 进行 分 割 ， 示 例如 下 : 


for (j=0; j<=n; j++) for (j=0; j<=n; j++) 
plil=... ; {plil= …; 

for (j=0; j<=n; j++) < p= pli} + ...} 
pUJ= pli) + … 


如 果 目 标 处 理 器 提供 了 可 以 用 于 较 小 循环 的 零 开 销 循环 指令 ， 那 么 使 用 左 侧 的 
版 本 可 能 会 更 有 效率 。 右 侧 的 代码 版 本 有 可 能 会 提高 缓存 的 使 用 率 (由 于 数组 p 
的 访问 存在 局 部 性 ) ， 并 且 会 增加 循环 体 的 并 行 计算 能 力 。 与 其 他 转换 相 比 ， 上 述 
的 转换 只 能 说 对 各 个 场景 各 有 优势 ， 很 难 界定 哪 种 转换 方式 更 加 合理 。 

3) 循环 展开 : 循环 展开 是 在 创建 若干 循环 体 的 实例 时 的 标准 转换 方法 ， 进 行 


一 次 循环 展开 的 示例 如 下 : 
for (j=0; j<=n; j++) for (j=0; j<=n; j+=2) 
plj]= … ; => {p[]= …; 


p[j+1]= …} 
循环 的 复制 数 被 称 作 展开 系数 ， 展 开会 降低 循环 的 开销 (与 原始 循环 体 相 比 ， 
其 分 支 更 少 ) 并 提升 系统 运行 速度 。 在 某 些 极端 情况 下 ， 可 以 将 循环 完全 展开 ， 
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以 此 完全 移 除 控制 以 及 分 支管 理 的 开销 。 有 了 时 可 以 对 循环 进行 若干 次 的 转换 变换 ， 
这 样 展 开 的 程序 与 未 展开 或 展开 一 次 的 相 比 会 更 有 优势 。 然 而 展开 会 导致 代码 长 度 
的 增加 ， 展 开通 常 被 限制 为 循环 常数 的 迭代 次 数 。 


7.2.3 循环 分 块 


处 理 器 速度 的 提升 是 优 于 存储 器 速度 的 提升 的 。 由 于 较 小 容量 的 内 存 与 大 
容量 内 存 相 比 有 着 速度 优势 ， 使 用 分 级 存储 结构 可 能 会 对 系统 效率 更 有 帮助 
这 些 “小 ”容量 存储 器 可 能 会 包含 缓存 等 存储 器 。 使 用 这 些 存储 器 的 原因 是 
基于 某 些 信息 的 重用 因素 ， 如 果 不 考虑 重用 ， 那 么 分 层 结构 的 存储 体系 就 毫 无 
意义 。 

重用 的 效果 可 以 通过 分 析 下 述 示例 证 明 ， 现 在 考虑 一 个 N * N 的 矩阵 乘法 
[ Lam et al. ，1991 ] : 

for (i=1; i<=N; i++) 

for(k=1; k<=N; k++){ 
r=X[i,k]; “分配 至 寄存 器 % 
for (j=1; j<=N; j++) 
Z[ += Y[k,j] 
} 

下 面 考虑 这 段 代码 的 访问 方式 。X [i, k] 在 最 内 部 的 循环 中 被 送 代 使 用 。 编 
译 咒 会 将 该 值 放 入 寄存 器 中 ， 并 且 在 最 内 部 的 每 次 循环 执行 时 进行 重用 。 假 设 数组 
中 的 元 素 以 行 主 序 进行 内 存 分 配 (与 标准 C -一致 ) 。 这 意味 着 相 邻 的 一 行为 索引 的 
数组 元 素 存储 在 相 邻 的 内 存 空 间 中 。 因 此 ， 在 最 内 部 的 循环 迭代 中 可 以 获取 相 邻 的 
Z5 Y 的 元 素 。 如 果 存 储 系统 使 用 预 取 技术 ， 那 么 该 技术 对 效率 的 提升 非常 有 帮助 
(每 当 有 一 个 机 器 字 的 数据 被 载 人 到 缓存 中 ， 将 相 邻 的 下 一 个 字 也 载 人 到 缓存 中 ) 。 
图 7. 7 显示 了 基于 该 代码 的 存储 器 访问 方式 。 
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图 7.7 Fee Aya pst 


对 于 最 内 部 循环 的 一 次 迭代 ， 数 组 Z 以 及 Y 被 访问 〈 并 被 载 人 至 缓存 中 ) , g 
存 中 使 用 过 的 相同 数据 是 否 在 下 次 的 迭代 循环 中 出 现 ， 取 决 于 缓存 的 大 小 。 在 最 坏 
的 情况 下 (假设 N 的 尺寸 较 大 ， 但 高 速 缓存 容量 较 小 ) ， 在 最 内 部 的 循环 每 次 执行 
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时 ， 相 关 信息 必须 重新 载 人 至 缓存 ， 此 时 缓存 中 的 信息 没有 进行 重用 。 可 以 在 高 速 
缓存 中 进行 引用 的 存储 空间 的 大 小 分 别 为 2N” (参考 Z) N (BBY) URN 
(参考 X) 。 
通过 对 访问 局 部 性 的 深入 研究 以 及 科学 计算 方面 的 研究 工作 使 得 循环 分 块 与 阻 
塞 技术 得 到 了 长 足 发 展 [Xue，2000] 。 下 面 为 一 个 基于 分 块 循环 的 算法 示例 : 
for (kk=1; kk<= N; kk+=B) 
for (jj=1; j<= N; jj+=B) 
for (i=1; i<= N; i++) 
for (k=kk; k<= min(kk+B-1,N); k++){ 
r=X[il[k]; /分配 至 寄存 器 */ 
for (j=jj; j<= min(jj+B-1, N); j++) 
zti] += r* Y(KIU] 
} 
图 7.8 显示 了 相应 的 访问 方式 。 
循环 
Bi 最 内 层 循环 

















kk 最 外 层 循 环 











图 7.8 基于 分 块 的 矩阵 乘法 访问 方式 


为 了 让 最 内 部 的 循环 减少 访 存 次 数 ， 故 对 最 内 层 循环 使 用 进行 若干 显示 (图 
中 用 黑 块 显示 ) 。 如 上 述 代码 所 示 ， 对 于 数组 X 的 引用 被 替换 为 了 对 r 的 引用 。 如 
果 选 择 了 某 种 可 行 的 块 因子 ， 当 最 内 部 的 下 次 循环 迭代 开始 时 ，Z 与 Y 依旧 在 缓存 
中 。 如 果 最 内 部 循环 的 元 素 的 大 小 与 缓存 相符 ， 那 么 就 可 以 选择 块 因子 B。 特 别 是 
当 有 一 个 Y 的 B*B 子 矩阵 与 缓存 相 匹 配 时 。 由 于 每 个 迭代 器 i 对 该 子 矩阵 的 访问 
次 数 都 为 B 次 ,这 与 Y 的 重用 因子 B 相对 应 。 此 外 , IB 与 Z 的 行 元 素 也 应 与 组 
存 是 相符 的 。 这 些 数据 可 以 在 进行 k 次 迭代 时 使 用 ， 这 导致 B 与 Z 的 重用 因子 是 
一 致 的 。 这 会 至 少 2N 7B 次 对 内 存 的 总 引用 。 实 际 上 ， 其 重用 因子 可 能 要 低 于 B。 
对 重用 因子 的 优化 是 一 个 综合 的 研究 领域 ， 最 开始 相关 研究 专注 于 对 性 能 的 提升 。 
Lam [Lam etal. , 1991] 发 表 了 关于 因子 为 3 与 4.3 的 矩阵 乘法 性 能 研究 分 析 的 相 
关 报 告 。 接 下 来 的 研究 方向 是 处 理 顺 与 存储 器 之 间 越 来 越 大 的 速度 差距 的 性 能 
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研究 。 分 块 也 可 以 降低 整个 存储 系统 的 功 耗 [Chung et al. , 2001], 
7.2.4 循环 分 割 


接 下 来 将 继续 讨论 用 于 程序 编译 之 前 的 另 一 个 优化 方法 ， 即 循环 分 割 。 这 个 优 
化 方法 也 可 以 添加 到 编译 器 中 进行 。 

许多 图 像 处 理 算法 需要 进行 某 些 滤波 处 理 。 滤 波 时 需要 对 某 些 特定 像素 以 及 邻 
近 像素 进行 图 像 滤 波 。 对 这 些 像素 进行 的 计算 也 比较 普通 ， 然 而 如 果 要 处 理 的 某 些 
像素 与 图 像 的 边界 相 邻 ， 有 可 能 没有 相 邻 像素 存在 ， 并 且 计 算 方式 必须 进行 修改 。 
在 某 种 滤波 算法 中 ， 这 些 修 改 有 可 能 在 算法 的 最 内 部 循环 中 被 执行 。 但 是 更 有 效率 
的 滤波 算法 会 将 处 理 普 通 情况 下 的 循环 体 与 处 理 某 些 异 常情 况 的 循环 体 分 割 。 


图 7.9 显 示 了 相关 的 转换 。 
—> | 无 需 检查 ， 几 乎 ||| 边界 检查 ， 
一 | 都 是 具体 的 像素 少量 的 像素 


图 7.9 将 图 像 处 理 过 程 分 割 为 常规 与 特殊 情况 





大 量 的 IF 语句 
用 于 边界 检查 




















手动 进行 循环 分 割 是 一 项 非常 有 难度 的 工作 ， 并 且 容 易 出 错 。Falk 等 人 发 布 
了 即使 大 尺寸 图 片 也 可 对 其 进行 自动 处 理 的 算法 [Falk and Marwedel, 2003], i% 
算法 基于 对 循环 数组 访问 的 精密 分 析 ， 通 常 使 用 遗传 算法 来 生成 最 优 的 解决 方案 
下 述 代码 显示 了 基于 MPEG-4 的 动态 估 值 的 循环 算法 : 

for (z=0; z<20; z++) 


for (x=0; x<36; x++) {xX1=4*x; 
for (y=0; y<49; y++) {y1=4"y; 
for (k=0; k<9; k++) {x2=x1+k-4; 
for (|=0; |<9; ) {y2=y1+l-4; 
for (i=0; i<4; i++) {x3=x1+i; x4=x2+i; 
for (j=0; j<4;j++) {y3=y1+j; y4=y2+j; 
if (x3<0 || 35<x3||y3<0||48<y3) 
then_block_1; else else_block_1; 
if (x4<0|| 35<x4||y4<0||48<ya) 
then_block_2; else else_block_2; 


PHHH 
使 用 Falk KFA, ARETA NALI FER: 
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for (z=0; z<20; z++) 
for (x=0; x<36; x++) {x1=4*x; 
for (y=0; y<49; y++) 
if (x>=10|/y>=14) 
for (; y<49; y++) 
for (k=0; k<9; k++) 
for (I=0; |<9;l++ ) 
for (i=0; i<4; i++) 
for (=0; j<4;j++) { 
then_block_1; then_block_2} 
else {y1=4*y; 
for (k=0; k<9; k++) {x2=x1+k-4; 
for (|=0; 1<9; ) {y2=y1+l-4; 
for (i=0; i<4; i++) {x3=x1+i; x4=x2+i; 
for (=0; j<4;j++) {y3=y1+); y4=y24j; 
if (0 || 35<x3 ||0|| 48<y3) 
then_block_1; else else_block_1; 
if (x4<0|| 35<x4]|y4<0||48<y4) 
then_block_2; else else_block_2; 
HHH 
为 了 替换 复杂 的 内 部 循环 ， 现 在 将 第 三 个 for 循环 语句 后 的 让 语句 进行 分 割 。 所 
有 的 常规 图 形 处 理 都 放 人 了 后 续 的 then 语句 中 ，Else 语句 处 理 剩 下 相对 较 少 的 情况 。 
图 7. 10 显示 了 对 于 不 同 的 处 理 器 以 及 应 用 来 说 ， 进 行 嵌 套 循环 分 割 后 可 以 节 


运行 时 间 
(%) A 














图 7.10 循环 分 割 结果 
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省 的 循环 周期 的 数量 。 

通过 对 算法 的 动态 估算 ,使 用 循环 分 割 算法 后 可 以 将 循环 次 数 最 多 降低 75% 
(其 原始 循环 次 数 的 25% ) 。 显 然 ， 对 于 循环 钥 套 类 程序 而 言 ， 其 算法 的 优化 空间 
巨大 ， 而 这 种 巨大 的 优化 可 能 是 无 法 被 忽略 的 。 


7.2.5 Ans 


对 于 某 些 能 入 式 应 用 ， 尤 其 是 多 媒体 领域 的 应 用 ， 其 代码 内 都 包含 着 大 量 的 数 
组 。 由 于 租 入 式 系统 的 存储 空间 有 限 ， 这 就 需要 找 出 一 种 能 够 降低 数组 所 需 存储 空 
间 的 方法 。 图 7. 11 显示 了 某 函 数 在 不 同时 间 如 何 使 用 5 个 数组 的 地 址 。 在 任何 的 
特定 时 间 ， 只 会 使 用 数组 元 素 的 某 一 子 集 。 所 需 元 素 的 最 大 数量 称 为 地 址 引用 窗 
[De Greef et al. ，1997b] 。 在 图 7. 11 中 ， 地 址 引用 窗 由 双向 箭头 表示 。 


A &E 














t t 


图 7.11 数组 的 引用 方式 


经 典 的 数组 内 存 分 配 如 图 7. 12 左 图 所 示 。 在 进程 执行 的 所 有 时 间 内 ， 每 个 数 
组 所 需 的 最 大 空间 都 会 被 分 配 (假设 考虑 的 是 全 局 数组 ) 。 


人 地 址 
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存储 空间 
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图 7. 12 RHEA (AA). Aree (PR) UR BOE ART BSR (AR) 




















图 7. 12 中 图 显示 了 内 部 数组 折 和 又 对 内 存 使 用 的 可 能 的 优化 方法 ， 不 在 同一 时 
刻 被 使 用 的 数组 可 以 共享 同一 段 地址 空间 。 图 7. 12 右 图 显示 了 基于 该 折 秋 算法 的 
演化 [De Greef et al. ，1997a] 。 该 算法 充分 利用 了 数组 内 的 有 限 集 ， 可 以 使 用 更 
加 复杂 的 地 址 算法 以 实现 存储 空间 的 节约 。 这 两 种 折 秋 算法 也 可 以 合并 使 用 。 
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Chung, Benini 以 及 De Micheli [ Chung et al. , 2001], [Tan et al. , 2003] 对 
其 他 上 层 转化 算法 进行 了 分 析 ， 并 对 编译 器 在 相关 领域 的 优化 做 出 了 卓越 的 贡献 。 

尤其 特别 要 提出 的 是 内 联 函 数 与 常规 调用 函数 的 蔡 换 。 使 用 内 联 函 数 会 提高 代 
码 的 运行 速度 ,但 是 与 此 同时 也 会 增加 最 终 执行 的 代码 的 长 度 。 在 SoC h, RER 
才 的 提高 会 带 来 一 系列 的 后 续 影 响 。 传 统 的 内 联 代码 需要 编程 者 指定 哪个 函数 被 定 
义 为 内 联 函 数 ， 但 是 对 于 片上 系统 而 言 ， 其 指令 存储 器 的 空间 有 限 ， 因 此 找到 一 种 
能 够 根据 目标 系统 存储 器 大 小 对 源码 自动 进行 内 联 函 数 转换 的 技术 就 非常 重要 。 
Teich [Teich et al. , 1999], Leupers 等 人 [ Leupers and Marwedel, 1999 | Palkovic 
[ Palkovic et al. , 2002] 以 及 Lokuciejewski [ Lokuciejewski et al. , 2009] 等 人 在 相 
关 技 术 方 面 进行 了 大 量 的 研究 。 这 些 基 础 既 可 以 继承 如 编译 器 中 转换 ， 也 可 以 在 源 
代码 编译 之 前 在 源 代码 中 进行 转换 。 


7.3 FF RAD KSA aie as 


7.3.1 简介 


很 明显 ， 大 多 数 程序 员 对 于 在 PC 上 运行 的 32bit 程序 的 优化 和 编译 已 经 有 了 
非常 深入 的 了 解 。 对 于 艇 人 式 系统 而 言 ， 由 于 标准 编译 器 通 党 非常 便宜 甚至 是 免费 
的 ， 扔 入 式 系统 也 经 常 使 用 标准 编译 器 进行 编译 。 

然而 ， 有 些 原因 导致 了 艇 人 式 系统 必须 使 用 定制 的 编译 需 : 

1) 艇 入 式 系统 的 处 理 器 架构 有 其 特殊 性 ， 编 译 器 可 以 使 用 这 些 特性 产生 出 非 
常 有 效率 的 代码 。 编 译 器 也 不 得 不 支持 3. 3. 3 节 所 描述 的 压缩 技术 。 

2) 能 够 高 效 运行 的 代码 比 能 够 用 高 效率 编译 出 代码 的 编译 器 更 加 重要 。 

3) 编译 器 在 满足 以 及 证 明 实时 性 约束 方面 可 能 会 有 帮助 。 首 先 ， 编 译 器 有 可 
能 包含 明确 的 时 间 模 型 ， 该 模型 可 以 用 于 时 间 行 为 的 优化 。 例 如 ， 该 模型 可 以 锁定 
缓存 线 ， 以 保证 某 些 频繁 被 执行 的 代码 不 会 被 换 出 缓存 。 

4) 编译 器 对 降低 钳 入 式 系 统 的 功 耗 也 有 帮助 。 编 译 器 可 以 对 系统 的 功 耗 进行 
某 些 优化 。 

5) 对 于 般 入 式 系统 来 说 ， 有 多 种 多 样 的 处 理 器 指令 集 ， 因 此 编译 器 要 对 不 同 
处 理 器 的 不 同 指令 集 都 进行 相应 的 支持 。 有 时 为 了 对 指令 集 进 行 优化 ， 甚 至 要 重 定 
向 编译 器 。 对 于 此 类 编译 器 ， 可 以 将 指令 集 设 置 为 编译 器 生成 系统 的 输入 。 这 些 系 
统 可 以 对 指令 集 进行 实验 性 的 修改 ， 并 且 对 修改 后 生成 的 机 器 码 进行 观察 。 例 如 
Tensilica 工具 [Tensilica Inc. , 2010] 就 对 上 述 需 求 提 供 了 支持 。 

[ Marwedel and Goossens, 1995] 的 文章 中 对 重 定 向 编译 器 进行 了 相关 描述 。 
在 Leupers [Leupers，1997] ，[ Leupers，2000a] 等 人 所 著 著 作 中 可 以 找到 与 优化 
相关 的 内 容 。 在 本 节 中 ， 将 会 展示 有 关山 入 式 处 理 器 的 相关 编译 技术 。 
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7.3.2 高 效 节能 编译 

许多 嵌入 式 系统 是 使 用 电池 作为 能 量 供应 源 的 移动 系统 。 与 移动 计算 能 力 的 不 
断 提升 相 比 ， 电 池 技 术 的 发 展 显得 相对 缓慢 [ITRS Organization, 2009], RE, xt 
于 新 的 应 用 而 言 ， 电 池 的 续航 能 力 成 为 了 移动 系统 发 展 的 瓶颈 。 

节能 可 以 在 系统 的 不 同 阶段 进行 ， 如 设备 工艺 、 电 路 设计 、 操 作 系 统 以 及 应 用 
程序 的 算法 ， 甚 至 芯片 的 制造 工艺 对 其 都 有 影响 。 从 源 代码 到 机 器 码 的 转换 对 系统 
节能 也 有 帮助 。7. 2 节 的 上 层 优 化 技术 对 降低 功 耗 也 有 助 益 。 本 节 将 着 眼 于 通过 对 
编译 器 的 优化 实现 对 功 耗 的 降低 (通常 称 为 低 功率 优化 ) 。 功 耗 优 化 基于 功 耗 模 
型 ， 在 第 5 章 已 经 介绍 了 若干 功 耗 模型 。 通 过 使 用 功 耗 模 型 ， 下 列 编译 器 可 以 用 于 
降低 系统 功 耗 的 优化 工作 中 : 

1) 节能 调度 : 在 不 改变 程序 目的 的 前 提 下 ， 可 以 改变 程序 中 指令 的 执行 顺 
序 。 通 过 改变 指令 的 执行 顺序 ， 可 以 对 指令 总 线 的 访问 进行 优化 。 这 种 优化 可 以 通 
过 编译 器 执行 ， 因 此 无 需 对 编译 器 做 任何 修改 。 

2) 节能 指令 选择 .通常 来 说 ， 对 于 同样 的 源 代码 可 以 生成 不 同 的 指令 序列 。 
对 于 标准 编译 器 而 言 ， 指 令 的 数量 或 者 代码 执行 的 周期 数 被 用 作 所 编译 出 来 的 代码 
是 拥有 优良 指令 序列 与 否 的 标准 。 该 序列 标准 可 以 被 系统 功 耗 标 准 代替 、Steinke 
等 人 发 现 ， 通 过 使 用 某 些 可 以 节能 的 指令 ， 可 以 降低 系统 功 耗 的 百分比 [ Steinke, 
2003], 

3) 对 成 本 函数 进行 蔡 换 也 可 以 用 于 其 他 的 标准 编译 器 优化 ， 例 如 寄存 器 流水 
线 、 循 环 不 变 式 代码 移动 等 。 此 类 优化 也 可 以 降低 若干 系统 功 耗 。 

4) 利用 分 级 存储 器 体系 : 如 3. 4 节 所 述 ， 较 小 的 内 存 拥有 更 快 的 访问 速度 以 
及 更 低 的 功 耗 ， 因 此 如 果 使 用 分 级 存储 器 体系 ， 那 么 可 以 节约 大 量 的 系统 功 耗 。 在 
Steinke [ Steinke et al. , 2002b], [ Steinke et al. , 2002a] 对 编译 优化 所 作 的 分 析 
中 ， 分 集 存储 体系 架构 所 节省 的 系统 功 耗 最 多 。 因 此 除了 使 用 较 大 的 后 台 存储 中 
外 ， 可 以 使 用 小 的 便签 式 存储 器 ( Seratch- Pad Memories，SMP) ， 这 样 对 系统 功 耗 
更 有 益处 。 对 较 小 范围 内 存 进行 寻 址 所 需 的 时 间 与 功 耗 都 低 于 对 大 内 存 的 寻 址 。 编 
译 器 负责 将 变量 与 指令 分 配 至 便签 式 存储 器 ， 但 是 该 方法 需要 更 频繁 地 对 变量 进行 
访问 ， 并且 代 码 序 列 也 需要 映射 至 该 地 址 范围 。 


7.3.3 ”基于 内 存 架构 的 编译 


7.3.3.1 基于 SPM 技术 的 编译 

使 用 SPM 的 优势 已 经 被 明确 证 明 [Banakar et al. , 2002], ， 因 此 使 用 SPM 可 以 
作为 内 存 分 层 结构 中 最 突出 的 示例 。 编 译 器 通常 可 以 将 内 存 对 象 映射 至 存储 器 的 鞭 
一 地 址 范围 ， 因 此 源码 通常 来 说 必须 进行 注释 。 例 如 ， 内 存 段 可 以 在 源码 中 使 用 类 
似 注 记 : 


220 KAA RAR 





RAKE EAR AAR ( 原 书 第 2 版 ) 





# pragma arm section rwdata =" foo" ,rodata = " bar" 

在 paragma 后 声明 的 变量 "foo" 将 被 映射 至 读 写 段 中 ， 常 量 "bar' 将 被 映射 至 只 读 
段 中 。 链 接 命令 接 下 来 会 将 这 些 段 映 射 至 特殊 的 地 址 范围 ， 其 中 也 包括 SPM。 这 
是 用 于 ARM 处 理 咒 的 编译 器 语句 [ARM Ltd. ，2009b] 。 使 用 这 种 方式 进行 标记 对 
于 程序 员 而 言 有 些 繁琐 ， 对 编码 者 而 言 ， 更 希望 有 一 种 能 够 对 经 常 访 问 的 对 象 进 行 
自动 映射 的 方法 ， 因 此 对 应 的 优化 算法 也 相应 衍生 。HiPEAC 提出 了 一 种 解决 方法 
[ Marwedel，2007 ] ， 可 用 的 SPM 优化 可 被 分 为 如 下 两 类 : 

1) 非 覆 盖 式 (或 “静态 " ) 内 存 分 配 策略 : 对 于 此 类 策略 而 言 ， 当 应 用 程序 运 
行 时 ， 与 其 对 应 的 内 存 对 象 始终 驻 留 在 SPM 中 。 

2) 覆盖 式 (或 “动态 "” ) 内 存 分 配 策略 : 对 于 此 类 策略 ， 内 存 对 象 在 程序 运行 
时 会 不 停 地 在 SPM 中 换 入 换 出 。 除 了 在 SPM 以 及 某 些 速度 较 慢 的 内 存 中 的 对 象 迁 
移 外 ， 该 分 配方 式 是 一 种 “编译 器 分 配 页 ”， 这 种 分 配方 式 与 磁盘 中 的 数据 对 象 
无 关 。 
7.3.3.2 非 覆 盖 式 分 配 

对 于 非 覆 盖 式 分 配 ， 可 以 考虑 对 函数 以 及 SPM 中 的 全 局 变量 进行 分 配 。 为 了 
该 目的 ， 每 个 函数 以 及 每 个 全 局 变量 都 可 以 被 视 作 函数 对 象 ， 令 : 

1) S 为 SPM 的 大 小 。 

2) sf, 以 及 sv, 分 别 为 函数 i 以 及 变量 i 的 大 小 。 

3) g 保存 每 次 进行 SPM 访问 所 需 的 功 耗 〈 即 对 慢 速 主 存 进行 每 次 访问 所 需 的 
功 耗 与 进行 SPM 所 需 的 功 耗 之 间 的 差 值 ) 。 

4) nf, 以 及 nv, 分 别 表示 函数 i 与 变量 i 的 被 访问 次 数 。 

5) xf, 以 及 xv, 定义 为 
1 ”如果 均 能 i 映射 到 SPM 


f=, an (7.1) 
w p ciate SPM a 
目标 为 最 大 的 系统 功 耗 值 : 
G=g( E mf. fi + D, nw; + xv; ) (7.3) 
以 及 相关 的 空间 约束 
Yo a, + > sv; * aww SS (7.4) 


该 问题 被 称 作 渐 缩 问题 。 标 准 渐 缩 算法 可 以 用 于 选择 分 配 至 SPM 中 的 对 象 ， 
然而 式 (7.3) 与 式 (7.4) 依旧 有 整形 线性 规划 (Integer Linear Programming, 
ILP) 问题 ( 见 附录 A), ， 并 且 ILP- solvers 也 可 以 使 用 。g 是 目标 函数 的 常数 因子 ， 
并 且 并 不 需要 解决 ILP 问题 。 相 应 的 优化 可 以 通过 使 用 前 通 优 化 实现 〈 见 图 
7.13), 
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a eee (ARM Bkgcc) ae 
wie [ 代码 
( 源 上 前 通 优化 = 编译 器 目标 代码 


存储 器 架构 描述 
(如 SRM 大 小 ) 





















图 7.13 前 通 优化 


优化 对 函数 的 地 址 以 及 全 局 变量 有 相应 的 影响 。 编 译 器 通常 允许 在 源码 中 对 这 
竺 地址 进行 手动 分 配 ， 因 此 编译 器 本 身 没有 任何 必需 的 变化 。 前 通 优化 的 优点 是 可 
以 编译 器 在 多 种 不 同 的 目标 处 理 器 上 使 用 ， 因 此 没有 必要 对 大 量 的 制定 目标 编译 
器 进行 修改 。 

该 模型 可 扩展 至 不 同 的 方向 

D 基本 块 的 分 配 ， 刚刚 描述 的 方法 只 允许 将 整个 函数 与 变量 分 配 至 SPM 中 
其 结果 是 ， 如 果 函数 或 变量 所 需 的 空间 较 大 ， 
SW SPM 将 会 有 小 块 的 空间 无 法 使 用 ， 因 此 尝试 | BBI 
对 分 配 至 SPM 的 对 象 进行 粒度 缩减 。 种 很 自 A 
然 的 选择 是 考虑 将 基本 块 作为 内 存 对 象 ， 此 
外 ， 还 考虑 一 组 相 邻 的 基本 块 ， 相 邻 的 含义 为 
一 组 由 处 理 器 所 定义 的 相 邻 指令 地 址 空间 ， 将 
这 种 相 邻 的 块 称 为 多 重 块 。 图 7. 14 显示 了 3 个 图 7 14 基本 块 以 及 多 重 块 
由 基本 块 BB1 、BB2 以 及 BB3 组 成 的 多 重 块 
M12、M23 以 及 M123, 

ILP 模型 可 以 被 扩展 如 下 ， 

& sb, 以 及 sm, 分 别 为 基本 块 i 以 及 多 重 块 i 的 尺寸 ， 
© 令 nb; 以 及 nm, 分 别 为 基本 块 i 以 及 多 重 块 i 的 访问 次 数 ， 
© $ xb, WR xm, 定义 为 


M123 











BB3 V 


1 如 果 基 本 块 i 映射 到 SPM 
xb, = ts 其 他 (7.5) 
PER l 如 果 多 重 块 i 映射 到 SPM (7.6) 
© l0 其 他 
所 能 获取 的 最 大 增益 为 


G=g( yf, “xf, + È nb, + xb, + 2 nm, ‘xm, + È m, * xv; ) (7.7) 
相应 的 约束 为 
Dish fi + Yi sb; im am, + hd <5 (7.8) 


i i 
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V 基本 块 i xb, + afai + xm, <1 (7.9) 


i’emultiblock (i) 

第 二 种 约束 保证 每 个 基本 块 到 SPM 的 映射 只 有 一 次 ， 而 非 封闭 函数 以 及 多 重 
块 的 映射 。 

Steinke [Steinke et al. ，2002b] 等 人 进行 了 基于 该 模型 的 相关 实验 。 对 于 某 些 
基准 测试 程序 而 言 ， 尽 管 能 够 放 入 SPM 的 数据 仅仅 占据 了 总 代码 量 的 一 小 部 分 ， 
但 是 最 多 还 是 可 以 降低 80% 的 功 耗 。 基 于 冒 泡 排序 所 得 的 测试 结论 如 图 7. 15 
所 示 。 


功 耗 /mJ 

i Me 便签 式 存储 器 
CO 主 存 

CPU 

















s $ ~ aS 
256 512 1024 2048 大 小 


图 7.15 基于 编译 器 SPM 映射 的 冒 泡 排序 所 降低 的 功 耗 








很 明显 ， 在 假定 系统 供给 电压 恒定 的 前 提 下 ，SPM 有 助 于 降低 系统 主 存 所 带 
来 的 功 耗 。 由 于 降低 了 处 理 器 等 待 周期 ， 所 以 对 于 处 理 器 功 耗 的 降低 也 有 帮助 。 
2) 分 块 存储 器 [Wehmeyer and Marwedel, 2006]: 较 小 的 内 存 拥有 更 快 的 运 
行 速 度 以 及 更 低 的 系统 功 耗 ， 因 此 将 处 理 器 分 为 若干 个 小 处 理 器 是 有 意义 的 。ILP 
模型 很 容易 就 可 以 扩展 用 于 若干 存储 器 的 模型 ， 在 此 情况 下 ， 不 区 分 内 存 对 象 的 不 
同类 型 ( 函数、 基本 块 、 变 量 等 )。 索 引 i 用 于 只 带 任意 内 存 对 象 ， 令 : 
© S, 作为 存储 器 7 的 大 小 ; 
@ s, AMR i WK]; 
© e 为 对 存储 器 j 每 次 访问 的 功 耗 ; 
@ n, 为 访问 对 象 j HRA; 
@) x 定义 为 
dd 
” lo 其 他 
为 了 最 大 化 降低 系统 功 耗 ， 需 要 降低 系统 的 整体 功 耗 ， 因 此 目标 为 尽量 减少 


C= Ye dx, +0, (7.11) 
7 i 


(7. 10) 
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Vii ps Si Xij SS; (7.12) 


Vi > mjel (7. 13) 


特别 是 对 于 不 同 的 内 存 需求 而 言 ， 进 行内 存 分 块 对 于 系统 效率 及 功 耗 而 言 是 有 
其 积极 意义 的 。 被 频繁 访问 的 存储 区 域 被 称 作 应 用 程序 的 工作 集 ， 拥有 较 小 工作 集 
的 程序 可 以 分 配 较 小 的 高 速 存储 器 ， 反 之 拥有 较 大 工作 集 的 程序 需要 分 配 更 大 的 存 
储 空间 。 因 此 ， 对 内 存 进 行 分 区 的 一 个 关键 优势 就 是 该 存储 器 可 以 适应 当前 工作 集 
的 不 同 大 小 。 

此 外 ， 没 有 使 用 的 存储 器 可 以 关闭 用 来 节省 功 耗 ， 然 而 考虑 到 只 有 对 内 存 的 访 
问 才 会 产生 “动态 ” 功 耗 。 此 外 ， 即 使 存储 器 空闲 ， 也 会 有 功 耗 产 生 ， 但 暂时 不 
去 考虑 这 种 功 耗 。 因 此 ， 关 闭 存储 器 所 节省 的 功 耗 并 没有 在 式 (7.11) 与 式 
(7.12) 中 有 所 体现 。 

3) 链接 /加 载 时 分 配 内 存 [Nguyen et al , 2005]: 在 编译 时 对 某 一 SPM 进行 
代码 优化 有 其 不 利 的 一 面 : 当代 码 运 行 于 某 些 不 同 架构 的 处 理 器 上 时 ， 如 果 这 些 处 
理 器 的 SPM 容量 不 同 ， 其 运行 效率 有 可 能 会 降低 。 要 尽量 避免 不 同 的 执行 文件 在 
不 同 的 处 理 器 上 运行 ， 因 此 对 独立 于 SPM 大 小 而 运行 的 可 执行 文件 更 感 兴趣 。 如 
果 在 链接 时 进行 优化 ， 则 上 述 场景 则 是 可 行 的 ， 计 算 的 方法 是 将 访问 次 数 除 以 变量 
在 编译 时 的 大 小 所 得 的 比值 以 及 存储 该 值 与 其 他 可 执行 文件 中 的 相关 变量 的 信息 。 
在 装载 时 ，0S 需要 获取 SPM 的 大 小 ， 然 后 对 代码 进行 对 应 的 优化 ， 使 其 尽 可 能 多 
在 SPM 中 进行 变量 的 分 配 。 

4) 在 栈 中 分 配 : 为 了 真正 的 降低 功 耗 ， 所 有 经 常 访 问 的 内 存 对 象 都 必须 分 配 
至 某 些 较 小 的 内 存 中 。 栈 也 是 需要 考虑 的 一 种 ， 否 则 对 栈 的 访问 将 会 限制 系统 的 整 
体 效率 。 目 前 至 少 有 两 种 方式 用 于 对 栈 的 访问 : Steinke [Steinke et al. ， 2002b] 通 
过 使 用 栈 容量 分 析 工 具 ， 可 以 计算 出 最 差 情况 下 栈 的 大 小 。 如 果 栈 足够 小 ， 则 可 以 
在 SPM 中 进行 分 配 。Avissar 等 人 [Arvissar et al. , 2002] 提出 了 一 种 对 栈 进行 分 
割 ， 使 其 可 以 对 频繁 访问 的 元 素 和 不 频繁 访问 的 元 素 进行 区 分 的 方法 。 访 问 次 数 不 
频繁 的 元 素 被 放置 在 慢 速 的 主 存 中 ， 而 访问 次 数 频繁 的 元 素 放置 在 SPM 中 。 调 度 
器 需要 知道 不 同 内存 中 栈 的 指针 。 为 了 降低 对 每 个 函数 调用 进行 两 个 栈 指针 更 新 的 
总 开销 ， 堆 栈 在 分 割 时 要 注意 不 要 对 “小 ” 函数 进行 相应 分 配 。 

5) 在 堆 中 进行 分 配 [Dominguez et al. ，2005] : 之 前 关于 对 栈 的 分 配 的 讨论 
也 适用 于 堆 ， 频 繁 被 访问 的 堆 元 素 也 应 被 分 配 至 运行 更 快 的 存储 器 中 。 可 以 使 用 堆 
尺寸 分 析 器 去 计算 堆 的 上 界 ， 较 小 的 被 频繁 访问 的 堆 可 以 完全 分 配 至 SPM 中 ， 然 
而 堆 的 尺寸 往往 大 于 SPM, Dominguez 等 人 提出 了 第 二 种 方法 ， 这 种 方法 认为 ， 程 
序 可 以 分 割 成 若干 个 区 域 ， 各 个 区 域 可 以 由 程序 指针 进行 限定 ， 这 些 程序 指针 对 于 
这 种 方法 来 说 极为 关键 。 程 序 指针 可 以 定义 为 [Udayakumaran et al ，2006]: — 
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“(i) 每 个 进程 的 开始 即 结束 ; Gi) 只 位 于 每 个 循环 开始 前 及 每 个 循环 结束 后 (其 
BAA MEI ) ; (Gii) 每 个 过 语句 的 then 部 分 和 else 部 分 的 开始 及 结束 以 
及 让 语句 的 开始 和 技术 ; Civ) 程序 的 switch 语句 的 每 个 case 分 支 的 开始 及 结束 以 
及 整个 switch 语句 的 开始 及 结束 ”。 

在 [Dominguez et al. , 2005] 中 提 到 ， 某 些 空间 在 SPM 中 始终 保持 是 可 用 的 ， 
并 且 每 个 时 刻 只 有 一 个 代码 区 可 以 进入 ， 如 果 有 需要 ， 堆 元 素 在 移 人 或 移出 SPM 
时 会 进行 相应 的 复制 。 如 果 该 复制 完成 ， 则 指向 堆 元 素 的 指针 始终 保持 有 效 。 

6) 考虑 到 对 时 间 可 预测 性 的 影响 [ Wehmeyer 以 及 Marwedel, 2006]: 无 论 访 
存 操作 发 生 于 高 速 内 存 还 是 低速 内 存 ， 大 多 数 的 SPM 分 配 算法 都 在 编译 时 进行 。 
因此 ， 相 较 于 对 缓存 的 访问 而 言 ， 对 存储 器 的 访问 速度 进行 预测 是 可 行 的 。 因 此 ， 
基于 SPM 系统 的 最 坏 情 况 下 访问 时 间 通 常 优 于 基于 缓存 的 系统 。 
7.3.3.3 LÆNE 

大 型 的 应 用 有 可 能 需要 多 个 热点 (多重 区 域 代码 包括 密集 计算 型 循环 ) ， 非 县 
加 的 方法 无 法 为 该 上 下 文 提供 最 好 的 系统 效能 。 对 于 这 些 应 用 而 言 ，SPM 可 以 用 
于 每 个 热点 ， 这 就 需要 代码 能 够 在 内 存 架 构 层面 进行 自动 迁移 。 有 若干 种 方法 可 以 
HTE: ; 

1) 平 铺 大 型 数组 [ Kandemir et al. , 2001], [Chen et al. , 2006]: 大 型 数组 由 
于 尺寸 无 法 满足 SPM 要 求 ， 所 以 使 用 SPM 时 可 能 会 产生 问题 。 目 前 所 提 到 的 算法 
不 能 将 数组 的 某 个 子 集 放 置 到 SPM 中 。Kandemir 提出 了 一 种 算法 可 以 用 于 该 种 场 
景 下 的 SPM 分 配 ， 该 技术 可 以 将 数组 分 片 复制 至 SPM 中 。 在 [Kandemir et al. , 
2001] 中 提 到 ， 平 铺 可 以 无 条 件 使 用 。 在 [Chen et al ，2006] 中 ， 作 者 提出 了 不 
要 对 不 规则 的 数组 进行 平 铺 访 问 ， 因 为 对 这 种 数组 进行 平 铺 访 问 会 导致 效率 低下 。 

2) 多 重 层次 分 配 [ Brockmeyer et al. , 2003]: 大 容量 存储 器 与 小 容量 存储 器 之 
间 的 访问 速度 差距 正在 不 断 拉 大 ， 因 此 提出 多 重 层 次 分 配 是 有 意义 的 。IMEC 的 
MHLA (架构 级 别 存储 器 分 配 ) 工具 尝试 找 出 一 种 能 够 在 不 同 存储 器 级 别 进 行 变量 
分 配 的 方法 。MHLA 在 程序 进入 循环 前 自动 选择 可 以 被 复制 至 快速 存储 器 中 的 数组 
子 集 。 该 工具 的 最 新 版 本 由 Mnemee project [ Mnemee project, 2010] 进行 了 相应 的 
设计 。 

3) 基于 区 域 的 内 存 对 象 迁移 [ Udayakumaran et al. , 2006]: 该 方法 基于 对 存 
储 器 的 分 区 以 及 程序 指针 。 每 个 程序 指针 需要 考虑 将 哪个 变量 移入 或 移出 SPM 
(代码 可 以 作为 一 种 变量 进行 模拟 ) 。 

4) Verma 的 方法 [Verma and Marwedel, 2004] 与 Udayakumaran 的 方法 类 似 ， 
然而 选择 要 复制 的 内 存 对 象 基于 全 局 ILP 模型 ， 而 非 本 地 数据 。 
7.3.3.4 多 线程 /进程 

上 述 方法 始终 限定 于 用 于 单 处 理 器 或 单线 程 下 的 场景 。 对 于 多 线程 而 言 ， 将 对 
象 移 入 或 移出 SPM 需要 在 进程 的 上 下 文中 进行 考虑 。Verma [Verma et al. , 2005 ] 
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提出 了 三 种 不 同 的 方法 : 

1) 对 于 第 一 种 方法 ， 在 给 定时 间 内 ， 只 有 一 个 处 理 器 拥有 SPM 空间 。 在 每 次 
上 下 文 切换 时 ， 被 抢占 的 进程 所 占据 的 SPM 空间 的 相关 信息 被 保存 ， 并 且 该 信息 
在 进程 再 次 被 执行 时 恢复 ， 该 方法 被 称 为 保存 /恢复 法 。 但 是 在 SPM 容量 较 大 的 情 
痪 下 ， 由 于 复制 过 程 需要 消耗 大 量 的 时 间 以 及 能 量 ， 该 方法 显得 不 是 特别 有 效 。 

2) 对 于 第 二 种 方法 ， 可 以 将 SPM 划分 为 若干 个 区 域 ， 以 供 不 同 的 进程 使 用 
划分 区 域 的 粒度 由 优化 级 别 来 决定 ，SPM 在 初始 化 时 就 被 填 满 。 这 里 不 需要 编译 
右 进 行进 一 步 的 编译 器 控制 复制 ， 因 此 该 方法 被 称 作 无 需 保 存 法 。 这 种 方法 只 有 在 
SPM 大 到 足以 包含 若干 进程 所 需 的 存储 空间 的 情况 下 才 有 意义 。 

3) 第 三 种 方法 被 称 作 混 合法 : 这 种 方法 将 SPM 分 割 为 若干 的 小 块 ， 这 些小 块 
可 以 供 不 同 的 进程 使 用 ， 此 外 再 留 有 一 个 较 大 的 存储 区 间 ， 以 供 所 有 进程 使 用 。 这 
两 种 区 间 的 空间 由 优化 级 别 来 决定 。 

Verma 的 方法 需要 在 编译 时 就 获知 一 组 进程 的 固定 信息 。 接 下 来 是 进程 在 系统 
中 的 运行 以 及 消亡 。Pyka 等 人 [Pyka et al. , 2007] 描述 了 集成 在 操作 系统 中 的 
SPM 存储 管理 器 (SPM Memory Manager，SPMM ) ， 该 组 件 用 于 在 运行 时 对 SPM 进 
行 分 配 。 与 之 前 的 算法 相 比 ，Pyka 的 方法 允许 在 对 库 进 行 预 编 译 时 将 库 中 的 代码 
BLA SPM 中 。 不 幸 的 是 ，Pyka 的 算法 需要 一 个 额外 的 中 间 层 。 尽管 这 个 额外 的 中 
间 层 增加 了 系统 的 总 开销 ， 但 是 所 获得 的 4 路 相连 缓存 可 以 降低 系统 25% ~ 35% 
的 总 功 耗 。 

如 果 系 统 的 存储 器 管理 单元 (Memory Management Unit, MMU) 是 可 用 的 ， 则 
上 述 的 额外 开销 是 可 以 避免 的 。Egger 等 人 [Egger et al , 2006] 通过 利用 MMU FF 
发 出 了 相应 的 技术 : 在 编译 时 ， 无 论 代码 段 是 否 可 以 通过 在 SPM 中 进行 分 配 而 获 
得 受益 ， 代 码 段 都 会 进行 相应 的 分 类 。 受益 的 代码 被 存储 在 某 一 虚拟 地 址 空间 中 ， 
最 开始 该 区 域 不 会 被 映射 到 物理 内 存 上 ， 因此 当代 码 第 一 次 被 访问 时 会 发 生 缺 页 异 
常 。 缺 页 异常 会 激活 SPMM，SPMM 会 对 SPM 空间 分 配 ， 并 对 虚实 地 址 转换 表 进 行 
更 新 。 

通常 来 说 ， 对 SPM 的 操作 需要 工具 的 支持 ， 但 更 需要 尺 好 的 系统 设计 。 如 果 
没有 这 种 工具 的 支持 ， 则 可 以 使 用 缓存 。 未 来 的 系统 有 可 能 同时 包含 缓存 以 
及 SPM。 


7.3.4 调和 编译 器 以 及 时 序 分 析 


如 今 所 有 可 用 的 编译 器 几乎 都 不 包含 时 序 模型 ， 因此 实时 软件 的 开发 者 通常 不 
得 不 遵循 软件 迭代 法 : 通过 该 种 编译 器 所 得 的 软件 是 无 法 得 知 相关 的 时 间 信息 的 。 
若 想 获知 相关 的 时 间 信息 ， 则 需要 某 些 工具 (如 aiT [ Absint, 2010]) 对 所 生成 的 
代码 进行 分 析 。 如 果 时 序 约束 不 满足 原 定 要 求 ， 则 需要 对 编译 器 运行 所 需 的 输入 进 
行 改 变 ， 并 再 次 进行 编译 ， 重复 该 过 程 直 到 满足 原 定时 序 约束 要 求 ， 称 其 为 基于 反 
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复试 验 的 实时 软件 开发 。 这 种 方法 存在 若干 问题 ， 首先， 所 需 的 迭代 数 在 设计 之 初 
是 未 知 的 ; 其 次 ， 这 种 方法 中 使 用 的 编译 器 是 “优化 ”的 ， 但 是 除了 目标 代码 的 
大 小 外 ， 对 程序 其 他 部 分 进行 精确 的 评估 是 不 可 能 的 。 因 此 ， 编 写 编译 器 的 程序 员 
只 能 期 望 这 些 “优化 ”对 相关 代码 的 质量 有 着 积极 的 影响 。 由 于 现代 处 理 器 的 行 
为 非常 复杂 ， 几 乎 没有 证 据 能 够 直接 证 明 这 种 期 望 。 最 后 ， 这 种 基于 反复 试验 的 实 
时 软件 开发 需要 设计 者 找 出 能 够 满足 实时 性 约束 的 恰当 的 编译 器 输入 。 

如 果 编 译 器 中 包含 了 时 序 分 析 模 块 ， 就 可 以 避免 使 用 这 种 基于 反复 试验 的 方 
法 。 多 特 蒙 德 理工 大 学 的 WCC 就 包含 了 该 模块 ， 旨 在 用 于 最 差 情 况 下 执行 时 间 开 
发 的 编译 器 。 独 立 于 现 有 产品 ， 开 发 一 个 完整 的 时 序 分 析 模 块 无 疑 是 极 大 的 资源 浪 
费 。 因 此 WCC 基于 aiT 的 时 序 分 析 模 块 与 TriCore 公司 试验 用 的 编译 器 进行 了 整 
合 。 图 7. 16 显示 了 WCC 的 整体 架构 。 
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图 7.16 能 够 获知 最 坏 情况 下 执行 时 间 的 编译 器 WCC 


WCC 使 用 ICD-C 编译 器 架构 [ICD Staff, 2010] 读 取 C 源 代码 并 进行 语义 分 
析 ， 该 源 代码 会 被 转化 为 “与 平台 无 关 的 中 间 表 示 层 ” (HL- 蕉 ) HL-IR 对 源码 
进行 了 抽象 表示 ， 各 种 优化 方法 都 可 以 用 于 HL-IR。 优 化 后 的 HL-IR 被 传送 至 选 
码 器 。 选 码 器 将 这 些 源码 的 操作 映射 至 对 应 的 机 器 指令 。 双 CC 至 今 为 止 一 直 专 注 
于 对 Infineon TriCore 架构 进行 支持 。TriCore 的 指令 集 由 低级 中 间 表 示 层 LLIR 进行 
表示 。 为 了 估算 WCET, s,, LLIR 会 通过 aiT (用 于 进行 LLIR 到 CRL2 的 转换 ) 转 
换 至 CRL2。aiT 会 根据 给 定 的 机 器 码 生 成 WCETEsw。 该 信息 会 转化 回 LLIR 模式 
(使 用 CRL 至 LLIR 转换 )。WCC 在 优化 时 会 使 用 该 信息 进行 WCET 的 估算 。 对 
LLIR 级 别 进 行 优 化 而 言 ， 该 方法 简单 、 直 接 ， 然 而 许多 的 优化 过 程 需要 在 HL-IR 
级 别 进行 。 在 该 级 别 进行 WCETss 优 化 需要 从 LLIR 到 HI-IR 级 逆向 注解 ，ICD-C 
包括 了 这 种 逆向 注解 。 

WCC 用 于 研究 在 编译 器 中 降低 WCETEst 对 于 优化 的 影响 。 这 些 结论 中 包括 采 
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用 这 一 目标 寄存 器 分 配 的 影响 的 研究 [Falk, 2009], 。 所 得 出 的 结论 有 些 戏剧 化 ， 
如 图 7. 17 所 示 。 
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图 7. 17 通过 使 用 WCET- aware 寄存 器 分 配 后 所 降低 的 WCET,., E] 


通过 使 用 WCC 的 已 知 WCET 寄存 器 分 配 ， 可 以 将 原始 的 WCET,。 的 平均 消耗 
降低 68. 8% 。 但 与 原始 的 WCETssr 相 比 ， 效 率 最 多 会 降低 24. 1% 。Lokuciejewski 等 
A [Lokuciejewski and Marwedel, 2010] 对 若干 优化 组 合 的 效果 进行 了 分 析 。 通 过 
使 用 相同 的 性 能 分 析 工 具 ，Lokuciejewski 发 现 相 比 于 原始 的 WCET,。， 效 率 最 多 有 
57. 1% 的 提升 。 


7.3.5 DSP 编译 
DSP 的 特性 已 经 在 3. 3. 3. 1 节 有 了 相应 的 描述 ， 编 译 器 应 充分 利用 在 第 5 章 提 
到 过 的 准则 进行 代码 优化 ， 可 以 使 用 地 址 生成 单元 作为 示例 以 证 明 这 些 技术 。 生 成 


“ 空 ”地 址 的 可 能 性 对 于 变量 如 何在 内 存 中 进行 布局 有 着 重要 的 影响 。 图 7. 18 给 
出 了 相应 的 示例 。 
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图 7.18 内 存 布局 对 比 


假设 对 于 某 些 基 本 块 ， 变 量 a ~ d 的 访问 基于 某 个 固定 顺序 (b, d, a, c, d, 
<)。 使 用 寄存 天 间接 寻 址 来 进行 这 些 变量 的 访问 。 首 先 ， 将 地 址 5 放 信 地址 寄存 器 
(多 图 7. 18 左 图 )。 由 于 目前 所 关注 的 是 地 址 生成 ， 与 变量 5 相关 的 机 器 指令 没有 
在 图 7. 18 中 标明 ， 因 此 用 于 访问 下 一 个 变量 (d) 所 生成 的 地 址 将 在 稍 后 进行 说 
明 。 假 设 寄存 器 A 只 能 放 入 一 个 地 址 ，4 必须 更 新 为 指向 变量 4 的 地 址 ， 这 需要 将 
当前 寄存 天 的 值 加 2。 接 下 来 ， 忽 略 读 取 变量 的 指令 ， 并 且 立 即 考虑 对 a 的 访问 。 
对 于 该 操作 ， 必 须 将 其 进行 减 3 操作 ， 并 且 在 下 次 访问 时 再 加 2。 假 设 自 增 以 及 自 
减 的 范围 被 限定 为 +:1， 只 有 图 7. 18 中 的 最 后 两 个 访问 可 以 通过 这 些 操作 进行 。 总 
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而 言 之 ， 需 要 在 指令 中 进行 地 址 的 计算 。 

与 之 相反 的 是 ， 对 于 图 7. 18 右 图 的 布局 ，4 个 地 址 的 计算 是 可 以 并 行 在 主 数 
据 通路 上 执行 的 自 增 与 自 减 操作 。 对 于 偏 移 大 于 1 的 操作 而 言 ， 只 需要 进行 两 个 周 
期 的 地 址 计算 。 在 这 里 也 没有 写 出 使 用 变量 的 指令 。 

如 何 生成 这 种 智能 的 内 存 布 局 ? 算法 通常 从 访问 图 ( 见 图 7. 19) 中 开始 进行 。 

这 些 访问 图 的 每 一 个 变量 都 与 一 个 节点 相对 应 ， 并 且 每 一 对 相 邻 的 变量 都 有 一 
个 连接 ， 这 些 连 接 的 权 值 与 相 邻 变量 的 访问 次 数 有 关 。 


QO © © = 
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变量 访问 图 最 大 线性 路 径 存储 器 布局 











图 7.19 对 单 地 址 寄存 器 4 的 内 存 分 配 访问 顺序 (b, d, a, c, d, c) 


由 高 权 值 的 连接 所 系 的 变量 应 该 被 分 配 至 相 邻 的 内 存 区 域 。 通 过 这 种 方式 保存 
的 地 址 计算 次 数 与 其 权 值 相等 。 例 如 ， 如 果 Hd 分 配 至 相 邻 的 区 域 ， 那 么 接 下 来 
的 两 次 访问 就 可 以 仅仅 通过 自 增 和 自 减 操作 进行 。 

进行 内 存 分 配 的 总 的 目标 就 是 找 出 一 种 内 存 中 变量 的 线性 次 序 ， 以 期 能 够 在 内 
存 寻 址 中 尽量 使 用 自 增 以 及 自 减 操作 。 这 与 找 出 访问 图 中 的 最 大 权 值 变量 的 先行 路 
径 对 应 。 不 幸 的 是 ， 在 图 中 最 大 权 值 路 径 问题 是 一 个 非 完全 多 项 式 问 题 ， 因 此 通常 
使 用 试探 法 来 生成 该 路 径 【Liao et al. ，1995b] ，[ Sudarsanam et al. ，1997] 。 通 常 
这 些 方法 都 基于 Kruskal 生成 树 。 下 面 为 Liao 算法 : 

1) 对 访问 图 C = (了 , E) 的 连接 进行 基于 权 值 的 排序 。 

2) 构造 一 个 新 图 G' =(V',，E'), 并 使 6G'=G、E' =0。 

3) 选择 图 G 最 高 权 值 的 连接 e， 如 果 该 连接 不 会 导致 C' 以 及 任意 G6' 的 节点 的 
周期 大 于 2， 则 将 其 加 入 节点 5' 中 ， 否 则 丢掉 e。 

4) 回 到 第 3 步 ， 选 择 G 中 权 值 尽 可 能 长 的 连接 ， 并 选择 (1 VI -1) 至 
C'H, 

隐 式 的 ， 所 有 节点 都 假设 由 权重 为 0 的 连接 所 系 ， 这 确保 了 即使 图 的 某 个 部 分 
没有 连接 ， 该 算法 也 能 继续 运行 。 变 量 在 存储 器 中 的 顺序 与 沿线 性 路 径 所 生成 的 变 
量 顺 序 相 对 应 。 

基于 图 7. 19 的 该 算法 的 应 用 示例 如 图 7. 20 所 示 。 

连接 (c<，d) ， 基 于 其 权重 ， 该 连接 为 第 一 个 加 入 图 G6' 中 的 连接 。 所 有 权重 为 
1 的 连接 中 ， 其 顺序 是 可 以 任意 排 布 的 。 假 设 (a, c) 接 下 来 加 入 图 中 ( 见 图 
7.20 中 图 ) (a, d) 有 可 能 是 接 下 来 需要 考虑 的 连接 。 该 链接 加 入 G6' 中 将 会 导致 
产生 一 个 循环 ， 所 以 该 链接 被 丢弃 ， 最终 (5b5，d) 加 入 图 6G'。 最 终 ， 图 中 加 入 了 
有 3 个 连接 的 4 个 节点 后 ， 算 法 停止 运行 。 





第 7 章 优 化 


229 

该 算法 仅仅 能 够 对 简单 的 场景 进行 处 O © © © @ @ 
理 。Leupers 以 及 Marwedel [ Leupers and 1 l ] 
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本 才干 的 论文 ， 该 方法 基于 更 复杂 的 场景 
对 该 算法 进行 了 扩展 ， 例 如 : 

1) n>1 地 址 寄存 器 [ Leupers and Marwedel, 1996]; 

2) 依旧 使 用 AGU 中 提 到 的 修改 寄存 器 [ Leupers and Marwedel, 1996], [Leu- 
pers and David, 1998]; 

3) 对 数组 进行 功能 扩展 【Basu et al. , 1999], 

4) 更 大 的 自 增 以 及 自 减 的 范围 [ Sudarsanam et al. , 1997 | 。 

该 方法 对 上 面 所 提 到 的 内 存 分 配 进行 了 代码 尺寸 以 及 实时 代码 生成 的 扩展 ， 还 
有 一 些 优 化 算法 利用 了 DSP 的 架构 特性 ， 例 如 . 

1) 多 重 存储 器 组 [ Sudarsanam and Malik, 1995]; 

2) 异 构 寄存 器 文件 [ Araujo and Malik, 1995]; 

3) 模 寻 址 [ Quilleré and Rajopadhye, 2000] ; 

4) 并 行 指令 集 [Leupers and Marwedel, 1995]; 

5) 多 种 操作 模式 「Liao et al. , 1995a], 

Leupers 描述 了 其 他 的 优化 技术 [ Leupers, 2000a] 。 


7.3.6 多 媒体 处 理 器 的 编译 


为 了 完全 的 支持 3. 3. 3. 1 所 描述 的 打包 数据 类 型 ， 编 译 器 必须 能 够 在 循环 中 对 
这 些 包 自 动 转 换 ， 这 样 就 可 以 生成 更 有 效率 的 软件 。 在 编译 器 中 实现 该 功能 是 _ 件 
非常 具有 挑战 性 的 任务 。 编 译 算法 用 于 打包 数据 类 型 的 操作 是 基于 超级 计算 机 的 向 
量 算法 所 作 的 扩展 ， 一 些 用 于 多 媒体 以 及 SIMD 的 短 向 量 扩展 算法 在 [Fisher and 
Dietz, 1998], ， [Fisher and Dietz, 1999], [Leupers, 2000b], [ Krall, 2000], 
[ Larsen and Amarasinghe, 2000 ] 相关 著作 中 进行 了 描述 。 

用 于 M3-DSP 的 自动 并 行 循环 需要 向 量化 技术 ， 该 技术 可 以 获得 显著 的 速度 提 
升 (与 顺序 操作 相 比 ， 见 图 7. 21) [Lorenz et al. , 2002], [ Lorenz et al. , 2004], 
对 于 应 用 程序 dot_product_2 而 言 ， 由 于 向 量 的 尺寸 过 小 ， 以 致 其 可 以 达到 非常 快 
的 速度 。 此 外 该 程序 不 需要 进行 数据 向 量化 。 如 果 向 量 操作 与 零 开销 循环 指令 相 结 
合 ， 则 最 多 可 以 降低 94% 的 系统 时 钟 周期 开销 。 

由 于 增加 了 SIMD 扩展 的 处 理 器 数量 ， 用 于 SIMD 指令 的 编译 备 受 关注 [Ren 
et al. , 2006], [Nuzman et al. , 2006 ] 。 特 别 是 用 于 Cell 处 理 器 的 编译 再 次 唤起 了 
人 们 对 于 这 种 编译 技术 的 兴趣 (例如 参见 Fichenberger 等 人 的 著作 ，[ Fichenberger 
et al. ，2005 ] ) 。 此 外 ， 编译 器 的 编写 者 所 研究 的 短 向 量 指令 技术 可 以 用 于 
Pentium @ 兼容 处 理 器 中 [ Gerber et al. ，2005 ] 。 对 于 这 个 充满 活力 的 研究 领域 ， 





图 7.20 Liao 算法 的 步骤 序列 
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图 7.21 通过 对 M3- DSP 向 量化 后 降低 的 周期 数 
想 提供 一 个 全 景 式 的 预览 也 是 很 难 做 到 的 。 
7.3.7 用 于 VLIW 处 理 器 的 编译 器 


VLIW 架构 需要 对 编译 器 进行 特殊 的 优化 : 

1) TMS 320C6xx 编译 器 优化 的 关键 是 能 够 在 编译 时 对 某 一 功能 单元 执行 某 种 
操作 。 由 于 该 处 理 器 有 两 条 数据 通路 ( 见 图 3. 28 ) ， 这 意味 着 具体 的 操作 需要 分 成 
两 个 对 应 的 子 集 [Jacome and de Veciana, 1999], ， [Jacome et al. , 2000], [ Leu- 
pers，2000e] ， 并 且 包 含 对 应 的 寄存 器 配置 文件 。 

2) VLIW 处 理 器 通常 有 若干 分 支 延迟 柳 。 对 于 VLIW 处 理 器 而 言 ， 由 于 每 个 
分 支 指令 槽 不 能 包含 完整 的 指令 包 ， 在 进行 分 支 处 理 时 VLIW 处 理 器 经 常会 获得 比 
其 他 处 理 器 更 多 的 时 间 开 销 。 例 如 ， 对 于 TMS 320C6xx 而 言 ， 其 分 支 延 迟 的 惩罚 
时 间 一 般 为 5 x8 =40 个 指令 。 为 了 避免 如 此 大 的 惩罚 ， 大 部 分 VLIW 处 理 器 支持 
对 大 量 的 状态 寄存 器 进行 预测 执行 。 预 测 执行 可 以 用 于 对 效率 要 求 较 高 的 短 下 语 
名 中 ， 对 于 长 让 语句 而 言 ， 由 于 其 可 以 在 then 以 及 else 分 支 中 互 斥 运行 ， 状 态 预 
测 可 以 获得 更 高 的 效率 。 可 以 找到 适当 的 优化 技术 在 两 种 让 语句 的 实现 方法 中 进 
行 权衡 [Mahlke et al. , 1992], [ August et al. , 1997], ，[ Leupers ，1999 ] 。 

3) 由 于 分 支 延 迟 的 惩罚 ，inline 函数 是 另 一 种 在 VLIW 处 理 器 中 常用 的 优化 
方法 。 

4) 在 对 Intel 公司 的 IA-64 EPIC 架构 处 理 器 进行 编译 器 设计 的 工作 方面 ， 研 
究 人 员 投 入 了 大 量 的 精力 (IL [Dulong et al. ，2001 ] ) 。 由 于 该 架构 的 独特 性 ， 需 
要 特殊 的 优化 技术 。 

5) Trimaran 用 于 在 指令 级 别 并 行 性 以 及 VLIW 和 EPIC 架构 方面 的 编译 器 技术 
人 研究 平台 [Trimaran, 2010], 
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7.3.8 用 于 网 络 处 理 器 的 编译 器 


网 络 处 理 器 是 一 种 新 型 的 处 理 器 ， 该 处 理 器 对 高 速 Internet 应 用 程序 进行 了 
优化 。 这 种 处 理 器 包含 了 对 数据 流 信息 中 的 位 域 进行 访问 及 处 理 的 指令 集 。 通 党 
而 言 ， 由 于 这 种 应 用 程序 对 于 数据 乔 吐 量 要求 极 高 ， 通 常 使 用 汇编 语言 进行 纺 
程 。 然 而 ， 越 来 越 复杂 的 网 络 协议 要 求 进行 此 类 编译 器 的 设计 时 需要 尽量 考虑 对 
有 具体 网 络 组 件 的 支持 。Falk 、Wagner 等 人 [ Falk et al. , 2006] 对 具体 的 bit 级 细 
节 进 行 了 分 析 。 

7.3.9 编译 器 的 产生 、 重 定向 以 及 设计 空间 的 研究 


在 设计 人 类 有 史 以 来 第 一 个 编译 器 时 ， 编 译 器 的 设计 工作 是 一 个 完 完全 全 的 手 
工 操作 过 程 。 在 此 期 间 ， 产 生 编译 器 所 需 的 某 些 步骤 8 慢 慢 地 可 以 通过 某 种 工具 自动 
进行 ， 例 如 lex 和 yace 以 及 更 多 的 类 似 工具 (I [Johnson，2010] ) 提供 了 一 些 标 
准 手 段 用 于 解析 源码 。 生 成 机 器 指令 是 编译 过 程 的 其 中 一 个 步骤 。 例 如 ， 类 似 olive 
[Tjiang, 1993] 的 树 模式 匹配 即 可 以 用 于 此 类 工作 。 尽 管 有 着 各 种 工具 可 以 使 用 ， 
编译 器 设计 还 是 无 法 彻底 自动 进行 ， 然 而 有 很 多 尝试 进行 重 定向 编译 器 设计 的 手 
段 ， 可 以 通过 不 同 种 类 的 可 重 定向 能 力 进行 分 类 . 

1) 开发 者 重 定向 能 力 :在 此 情况 下 ,编译 器 的 专家 负责 对 新 的 指令 集 进行 纺 
译 器 重 定向 。 

2) 用 户 重 定向 能 力 : 在 此 情况 下 ， 使 用 者 负责 对 编译 器 进行 重 定 向 。 这 种 方 
法 通常 而 言 更 具 挑战 性 。 

更 多 的 有 关 编 译 器 的 重 定向 以 及 在 设计 空间 进行 研究 的 信息 可 以 在 Leupers 以 
及 Marwedel [ Leupers and Marwedel, 2001 | 的 书籍 中 获得 。 包含 上 述 功能 的 商业 产 
品 可 以 参见 Tensilica 公司 相关 产品 [ Tensilica Inc. , 2010], 





7.4 电源 管理 以 及 温度 管理 


7.4.1 动态 电压 调节 


茶 些 嵌入 式 处 理 器 支持 动态 电源 管理 以 及 动态 电压 调节 (Dynamic Voltage 
Scaling，DVS) ， 可 以 使 用 这 些 特征 用 于 进行 系统 优化 。 通 常 来 说 ， 优 化 是 随 着 编 
译 器 生成 代码 的 过 程 进行 ， 但 使 用 上 述 两 种 方式 进行 的 优化 则 需要 对 系统 的 所 有 任 
务 有 一 个 全 局 性 的 总 览 ， 包 括 这 些 任务 的 依赖 性 以 及 时 间 片 信息 等 。 

接 下 来 的 示例 [Ishihara and Yasuura, 1998] 证 明了 动态 电压 调节 在 系统 优化 
方面 的 潜力 。 假 设 有 一 个 能 够 在 3 种 不 同 电压 (2. 5V、4.0V 以 及 5.0V) 下 运行 
的 处 理 器 ， 假 设 处 理 器 运行 于 5. OV 电压 下 ， 每 个 时 钟 周期 的 系统 功 耗 是 40n]， 式 
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(3.14) 可 以 用 于 计算 其 他 电压 下 的 系统 功 耗 〈( 见 图 7. 22，2. 5nJ 是 一 个 约 值 ) 。 

此 外 ， 假 设 任务 需要 在 25s 内 运行 10” 个 时 钟 周 期 。 在 图 7.23 ~ 图 7.25 中 可 
见 ， 该 任务 有 若干 种 执行 的 形式 。 在 使 用 最 大 电压 的 情况 下 (示例 a， 见 图 7. 23), 
处 理 器 有 5s 的 时 间 处 于 空闲 状态 (假设 在 此 期 间 处 理 器 功 耗 为 0)。 


VaglV 





每 个 周期 的 能 耗 /ny 
JSmax/ MHz 


执行 周期 /ns 





图 7.22 拥有 DYVS 的 处 理 器 特征 图 7.23 第 一 种 电压 计划 表 


忆 一 种 场景 下 〈 示 例 b) ， 在 最 开始 使 用 全 速 运行 处 理 器 并 在 任务 运行 完毕 后 ， 
将 系统 电压 降 到 最 低 〈 见 图 7.24) 。 

最 终 ， 让 处 理 器 运行 在 能 够 满足 任务 死 线 约束 的 最 低 电 压 中 (示例 ce， 见 图 
7.29) 6 





b) (V2) Å 750M 周 期 @50MHz+250M 周期 @25MHz c) (V2) 
52 





42 





图 7.24 第 二 种 电压 计划 表 图 7.25 第 三 种 电压 计划 表 


相应 的 功 耗 可 以 通过 下 式 进 行 计算 : 


E, =10° x40 - 10°’ =40(J) (7. 14) 
E, =750 + 10° x40 - 10°? +250 . 10° x10 - 10™ = 32. 5(J) (7.15) 
E, =10° x25 - 10°? =25(J) (7.16) 


可 以 发 现 ,在 第 三 种 场景 即 系统 电压 稳定 在 4V 的 情况 下 ， 系 统 功 耗 最 低 。 接 
下 来 将 使 用 术语 可 变 电 压 处 理 器 用 于 描述 允许 使 用 任意 电压 的 处 理 咒 。 能 够 支持 任 
意 电 压 的 可 变 电 压 处 理 器 价格 非常 昂贵 ， 因 此 实际 的 处 理 器 仅仅 支持 大 干 个 固定 的 
电压 。 

在 上 述 事例 中 进行 观察 所 得 出 的 结论 可 以 用 如 下 声明 进行 描述 ，Ishihara 以 及 
Yasuura 在 其 论文 中 对 这 些 声 明 进 行 了 相应 的 证 明 : 

1) 如 果 处 理 器 在 某 个 可 用 电压 下 提前 完成 了 任务 ， 那 么 系统 功 耗 可 以 降低 2 。 





© Ishihara 与 Yasuura 的 论文 中 明确 地 使 用 了 隐 含 假定 的 论点 。 
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2) 如 果菜 个 处 理 器 使 用 单一 电压 V, 并 且 在 任务 了 死 线 到 来 的 时 刻 将 任务 了 运 
行 完毕 ， 那 么 在 电压 V, 下 运行 任务 了 可 以 得 到 最 低 的 系统 功 耗 。 

如 果 处 理 器 可 以 使 用 若干 离散 的 电压 ， 那 么 电压 计划 表 可 以 选择 使 用 两 个 相 邻 
的 理想 电压 值 fs。 这 两 个 电压 值 可 以 使 系统 功 耗 为 最 低 功 耗 2 。 

它 可 以 用 于 对 某 些 任务 指定 其 运行 电压 。 接 下 来 考虑 将 某 个 电压 分 配给 某 组 任 
务 ， 将 使 用 如 下 符号 : 

1) N: 任务 的 数量 。 

2) ECi: 任务 7 的 执行 周期 数 。 

3) L: 目标 处 理 器 可 运行 的 电压 数 。 

4) Vi: 第 :个 电压 ，1 <i=<L。 

5) F: 基于 电压 V; 的 时 钟 频率 。 

6) D: 所 有 任务 必须 运行 完毕 的 全 局 死 线 。 

7) SC: 在 执行 任务 j 时 的 平均 开关 电容 量 (SC, 包括 实际 电容 量 C, 以 及 开关 
KB a [ 见 式 (3.14) ] 

电压 调节 问题 可 以 用 整数 线性 规划 (Integer Linear Programming, ILP) 问题 描 
述 。 为 达到 该 目的 ， 引 入 变量 Xy, BERITE EE TF AIHE AC. 

基于 ILP 模型 的 假设 包括 : 

1) 一 个 可 以 在 有 限 个 离散 数量 电压 下 运行 的 目标 处 理 器 。 

2) 进行 电压 转换 所 和 需 的 时 间 可 以 忽略 不 计 。 

3) 每 个 任务 运行 所 需 的 最 多 周期 数 是 已 知 的 。 

使 用 这 些 假设 ，ILP 问题 可 以 论证 如 下 : 


最 小 化 
N L 
E= YY, SC 五， 及 (7.17) 
jel gal 
依赖 于 
Wk 二 三 机 (7. 18) 
i=l 
以 及 
N L ex 
2hr (7. 19) 


目标 是 找到 每 个 任务 7 在 某 一 电压 V 执行 时 所 需 的 周期 数 X,;。 通 过 上 述 声 明 ， 
没有 任何 任务 需要 两 个 以 上 的 电压 值 。 使 用 该 模型 ，Ishihara 以 及 Yasuura 指出 如 
果 任 务 使 用 的 电压 越 高 ， 则 系统 效率 通常 越 高 。 如 果 有 大 量 的 系统 空闲 时 间 ， 可 以 
通过 尝试 不 同 的 电压 值 找到 对 系统 效率 最 优 帮 助 的 电压 值 。 然 而 对 处 理 器 而 言 ， 能 





O ”在 最 初 的 论文 中 并 没有 将 这 些 考虑 在 内 。 
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够 提供 4 种 不 同 的 电压 值 就 足以 处 理 不 同 的 场景 。 

在 许多 示例 中 ， 程 序 的 运行 速度 都 快 于 预测 的 最 坏 情况 下 执行 时 间 。 但 上 述 的 
算法 并 不 能 对 这 种 情况 进行 描述 。 在 使 用 检查 点 对 实际 的 最 坏 情况 下 执行 时 间 与 预 
测 执行 时 间 相 比 对 并 通过 该 信息 降低 系统 电压 时 [ Azevedo et al ，2002] ， 可 以 将 
此 限制 移 除 。 另 外 ， 多 速率 任务 图 下 的 电压 调节 也 被 提出 [Schmitz et al. , 2002], 
DVS 可 以 作为 一 个 优化 手段 与 其 他 优化 方法 一 起 使 用 ， 例 如 体 偏 压 [Martin et al. , 
2002] 。 体 偏 压 是 一 种 用 于 降低 漏电 流 的 技术 。 


7.4.2 动态 电源 管理 


为 了 降低 系统 功 耗 ， 也 可 以 使 用 3. 3. 3 节 所 述 的 电源 节能 状态 。 使 用 动态 电源 
管理 (Dynamic Power Management, DPM) 的 根本 问题 是 在 什么 时 候 进 入 电源 节能 
状态 ? 一 个 直接 而 简单 的 方法 是 使 用 一 个 定时 器 转换 至 节能 态 。 使 用 更 加 复杂 的 随 
机 过 程 模 型 计算 系统 闲置 时 间 可 以 更 准确 地 预测 系统 的 使 用 状况 。 基 于 指数 分 布 的 
模型 已 经 被 证 明 是 不 正确 的 。 更 新 的 理论 描述 了 更 加 精确 的 系统 模型 【Simunic et 
al. , 2000]. 

有 关 电 源 管理 的 全 面 讨论 的 论文 已 被 发 表 (参见 [ Benini and De Micheli, 
1998], [Lu et al. ，2000] ) 。 这 些 更 先进 的 算法 将 DVS 以 及 DPM 一 起 使 用 用 于 系 
统 节 能 的 优化 [Simunic et al. , 2001], 

分 配 DPM 的 电压 以 及 对 DPM 的 转换 时 间 进 行 计 算 可 能 在 伐 人 式 软件 优化 过 程 
中 需要 分 两 个 步 又 进行 。 

功 耗 管理 与 散热 管理 紧密 相连 。 散 热管 理 依赖 于 运行 时 的 系统 温度 信息 。 这 些 
信息 用 于 处 理 系统 的 发 热 ， 并 使 用 系统 制冷 机 制 对 系统 进行 冷却 。 在 系统 散热 管理 
中 ,控制 风扇 转速 是 最 简单 而 有 效 的 手段 。 此 外 ， 如 果 系 统 温度 超过 了 阅 值 ， 则 系 
统 有 可 能 彻底 关闭 。 更 先进 的 系统 有 可 能 会 降低 系统 的 时 钟 频 率 以 及 电压 。 对 于 多 
核 系 统 而 言 ， 任 务 有 可 能 在 不 同 的 核 上 运行 。 在 所 有 这 些 情况 下 ， 要 对 系统 运行 时 
的 “温度 ”进行 客观 评价 ， 评 价 所 得 的 结论 会 对 系统 运行 产生 深刻 的 影响 。Merkel 
等 人 [Merkel and Bellosa, 2005] 以 及 Donald 等 人 [ Donald and Martonosi, 2006 ] 
发 表 了 如 何 避 免 系统 过 热 方面 的 著作 。 


7.5 思考 题 


. 考虑 下 面 这 样 一 个 程序 : 
#include < stdio. h > 
#define DATALEN 15 
#define FILTERTAPS 5 
double x[ DATALEN ] = | 128. 0,130. 0,180. 0,140. 0,120.0, 


RW N =e m 
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5 110. 0,107. 0,103. 5,102. 0,90. 0, 

6 84. 0,70. 0,30.0,77.3,95.7 |}; 

7 const double h[ FILTERTAPS ] = | 0. 125, -0. 25 ,0.5, —0. 25,0. 125 |}; 
8 double y[ DATALEN] ;// 结果 ; 

9 


int main( void ) 


10 { inti,n; 
11 for(i =0;i <DATALEN; + +i) 
12 { y[i] =0; 


13 for(n =0;n <FILTERTAPS; + +n) 

14 if((i-n) > =0)y[i] + =h[n] *x[i-n]; 

I5 } 

16 for(i=0;i<DATALEN; + +i) printf("%.2f",y[i]); 

17 return 0; 

18 } 

至 少 完成 如 下 优化 : 

1) 移 走 最 内 循环 的 这 语句 (第 14 行 ); 

2) 进行 循环 展开 (第 13 行 ); 

3) 进行 常数 传 用 ; 

4) 浮 点 数 到 定点 数 的 转换 ，; 

5) 避免 对 数组 的 所 有 访问 。 

请 提供 程序 进行 优化 转换 后 的 版 本 并 对 结果 进行 一 致 性 检测 。 

2. 假设 变量 fa, b, c, d, e, f) 的 访问 顺序 为 (caedfadadec bfded 
fbada), 

此 外 ,假设 处 理 器 有 如 下 特征 : 

1) 只 有 一 个 地 址 寄存 器 AR; 

2) 所 有 对 存储 器 的 访问 都 必须 通过 AR; 

3) 后 增 以 及 后 减 1 的 操作 可 以 被 编码 如 加 载 一 存储 指令 中 ; 

4) 对 AR 内 容 进行 改变 需要 额外 的 指令 以 及 额外 的 周期 。 

使 用 Liao 的 算法 ， 计 算 一 个 能 够 减少 总 的 地 址 计算 时 间 的 可 用 访问 顺序 。 其 
中 需要 将 该 算法 的 每 个 步骤 用 图 形 明 确 表示 。 

使 用 汇编 语言 进行 编程 ， 形 成 一 个 可 用 的 访问 序列 。 所 有 的 访问 都 假设 是 
对 内 存 的 读 GEF) 访问 。 使 用 如 下 的 汇编 指令 (具体 的 指令 语义 说 明 
在 右 侧 ) : 
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Id r,(AR); register[r]:= memory[AR] 

Id r,(AR)++; register[r]:= memory[AR]; AR++; 
Id r,(AR)- -; register[r]:= memory[AR]; AR- -; 
li AR,constant; AR:=constant; 


addi AR,constant; AR:=AR+constant; /常量 可 以 为 负 


3. 假设 计算 机 配备 有 主 存 以 及 SPM， 存 储 器 的 容量 以 及 每 次 访问 所 需 的 功 耗 
如 图 7. 26 所 示 。 











存储 器 大 小 /B | 每 次 访问 所 需 功 耗 
便签 式 存储 器 4096 (4k) 1.3 nJ 
主 储存 器 262,144 (256 k) 31 nJ 














图 7.26 存储 器 特征 
假设 访问 如 图 7. 27 所 示 的 变量 。 
倘若 使 用 静态 的 、 非 覆盖 式 变量 ， 其 中 哪些 变量 应 该 分 配 在 SPM 中 ? 使 用 ILP 

模型 选择 对 应 的 变量 ， 管 案 应 包括 ILP 模型 以 及 其 对 应 的 结论 。 可 以 使 用 jp_solve 
程序 [ Anonymous, 2010a] 解决 ILP 问题 。 














变量 大 小 /B 访问 次 数 

a 1024 16 

b 2048 1024 
c 512 2048 
d 256 512 
e 128 256 
S 1024 512 
g 512 64 

h 256 512 

















图 7.27 变量 特征 





4. 循环 展开 是 一 种 非常 有 用 的 优化 方式 ， 请 指出 这 种 优化 方式 的 两 种 优点 以 
及 两 种 缺点 。 


81 总 览 


测试 的 目的 是 保证 所 制造 的 嵌入 式 系统 的 行为 与 预期 相符 。 测 试 既 可 以 在 产品 
生产 过 程 中 进行 ， 还 可 以 在 产品 生产 完毕 后 进行 (制造 测试 ) ， 还 可 以 在 系统 交付 
给 客户 后 进行 (现场 测试 ) 。 在 进行 嵌入 式 测试 时 ， 应 特别 注意 如 下 因素 

1) 用 于 实际 环境 中 的 嵌入 式 物理 子 系统 有 可 能 是 与 实际 安全 息息相关 的 。 因 
H, 嵌入 式 系统 与 常用 的 办 公设 备 相 比 ， 一 旦 出 现 故 障 则 会 导致 产生 更 加 严重 的 后 
果 。 因 此 ， 产 品 的 质量 就 必须 远 远 高 于 与 安全 无 关 的 系统 。 

2) 测试 对 时 间 要 求 严格 的 系统 时 必须 确保 系统 的 时 间 行 为 是 正确 的 。 这 意味 
着 仅仅 对 系统 功能 进行 测试 是 不 够 的 。 

3) 在 能 人 式 系统 实际 的 运行 环境 中 进行 测试 有 可 能 是 比较 危险 的 。 例 如 ， 测 
试 核电 站 的 控制 软件 可 能 会 导致 对 测试 者 产生 某 些 严重 的 问题 。 

在 设计 阶段 就 应 该 进行 测试 的 准备 工作 ， 这 样 在 产品 研发 的 初期 就 可 以 对 测试 
工作 提供 一 定 的 支持 。 在 设计 过 程 中 就 可 以 对 产品 的 可 测试 性 进行 设计 评估 。 为 了 
简化 第 5 章 的 内 容 ， 将 所 有 与 测试 有 关 的 内 容 放 到 本 章 进行 说 明 。 尽 管 在 进行 实际 
的 产品 设计 时 ， 测 试 应 尽 可 能 早 参 与 到 设计 阶段 ， 但 是 在 示例 图 中 ， 测 试 放 到 了 设 
计 流 程 中 的 最 后 一 步 〈 见 图 8.1)。 然 而 ,将 测试 放 入 产品 设计 阶段 并 不 是 一 种 党 
见 的 开发 方式 ， 因 此 图 8. 1 也 是 与 实际 的 设计 流程 相对 应 的 。 


a 设计 仓库 (er) 













规格 说 明 书 


系统 软件 
(RTOS、...) 


图 8.1 测试 是 设计 流程 的 最 后 一 步 















应 用 筹划 









优化 
评估 与 批准 




















在 测试 中 ， 通 常 认为 所 设计 的 系统 (System Under Design, SUD) 就 是 被 测 设 
% (Device Under Test，DUT) 。 在 DUT 中 ,会 使 用 一 系列 特殊 的 、 被 选 定 的 被 称 
作 测试 用 例 的 输入 用 例 输入 至 系统 中 ， 并 观察 系统 行为 是 否 与 所 预期 的 行为 相符 。 
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这 些 测试 用 例 通常 适用 于 实际 的 、 已 经 制造 并 运行 的 系统 。 测 试 的 主要 目的 是 鉴定 
尚未 正确 生产 的 系统 以 及 以 生产 的 系统 是 否 有 潜在 故障 。 

测试 包括 如 下 步 又 : 

1) 测试 用 例 生 成 ; 

2) 测试 用 例 的 使 用 ; 

3) 响应 观测 ; 

4) 结果 比较 。 


8.2 测试 过 程 


8.2.1 门 级 别 测试 用 例 生 成 


在 测试 用 例 的 生成 过 程 中 ， 需 要 鉴别 该 组 测试 用 例 能 否 鉴别 系统 是 不 是 正常 运 
行 的 。 测 试用 例 的 生成 通常 基于 故障 模型 ， 这 些 故 障 模型 模拟 可 能 的 故障 。 所 产生 
的 测试 用 例 尝试 生成 能 够 对 该 错误 模型 进行 所 有 故障 测试 的 测试 用 例 。 

困 在 故障 模型 通常 用 于 故障 模型 中 。 该 模型 基于 电路 中 的 内 部 线路 永远 地 被 连 
至 '0” 或 '1” 上 的 假设 。 据 观察 ,许多 实际 的 故障 电路 中 ,其 内 部 线路 就 被 通过 
该 种 方式 进行 了 永久 性 的 链接 。 例 如 ， 参 考 图 8. 2 所 示 的 电路 。 
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图 8.2 门 级 别 的 测试 用 例 


假设 要 检测 当 信 号 /的 固定 1 故障 。 为 此 目的 ， 通 过 设置 a=5='0” 让 /等 于 
0。 如 果 f 等 于 1， 则 此 处 有 故障 ， 否 则 了 应 当 为 0。 为 了 观测 了 的 值 ， 将 通过 信号 i 
输出 结果 。 为 实现 这 一 目标 ， 必 须 将 e 设置 为 1 并 且 将 c 或 d 也 设置 为 1。 如 果 没 
有 故障 发 生 ，h 与 i 则 为 1， 否 则 为 0。 测 试用 例 包含 了 a ~e 的 所 有 可 输入 的 值 。D 
算法 可 以 用 于 产生 该 测试 用 例 [Lala, 1985], 

许多 用 于 生成 测试 用 例 的 技术 都 是 基于 固定 故障 模型 的 ， 然 而 COMS 技术 需要 
更 多 的 综合 故障 模型 。 在 CMOS 技术 中 ， 故 障 可 以 改变 设备 的 内 部 状态 。 一 旦 线路 
REMI 〈 例 如 stuck- at- open 故障 ) ， 该 错误 就 会 发 生 ， 因 此 门 电路 的 晶体 管 就 会 





O 请 记 住 : 为 了 符合 ANSVIEEE 91 标准 ， 符 号 >1 以 及 & 分 别 表示 或 门 以 及 与 门 。 
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断 开 。 这 些 晶 体 管 是 否 导 通 ， 基于 线路 损坏 前 的 门 电路 存储 的 顶 极 的 电荷 。 这 样 通 
过 存储 的 电荷 ， 在 栅 极 就 可 以 “ 记 住 ”输入 的 信和 号。 此 外 ， 有 些 故障 也 有 可 能 由 
瞬时 故障 或 延迟 故障 所 产生 (故障 有 可 能 会 改变 电路 的 延 时 ) 。 延 迟 故 障 也 有 可 能 
是 由 于 线路 之 间 相 邻 导 线 的 信号 串扰 所 导致 ， 故障 模型 也 应 将 此 类 硬件 故障 考虑 在 
内 [ Krstié and Cheng, 1998 ] 。 

虽然 存在 着 良好 的 硬件 测试 模型 ， 但 是 该 模型 并 不 能 用 于 软件 测试 。 


8.2.2 自 测 程序 


对 现代 集成 电路 测试 的 另 一 个 关键 问题 是 其 有 限 的 引 脚 数量 使 得 对 内 部 组 件 的 
访问 越 来 越 困难 。 另 外 ， 在 这 些 电 路 全 速 运行 时 
对 其 进行 测试 也 非常 困难 ， 因 此 测试 者 使 用 的 工 Meera sem) 








具 必 须 至 少 与 要 测试 的 电路 一 样 快 。 事 实 上 ， 许 ~~~ 固定 0 故障 ? 
多 嵌入 式 系 统 的 处 理 器 提供 了 一 种 走出 该 困境 的 \ atu / 


方法 : 处 理 器 可 以 运行 测试 程序 或 对 电路 进行 诊 
断 。 这 些 诊断 的 方法 用 于 对 主 框架 机 的 测试 已 经 
有 几 十 年 的 历史 。 图 8. 3 显示 了 有 可 能 被 包含 在 
某 些 处 理 器 中 的 组 件 。 
为 了 测试 ALU 的 stuck-at- faults 输入 错误 ， 可 以 执行 如 下 一 段 测试 用 例 : 
将 所 有 为 "1” 的 类 型 存储 至 寄存 器 文件 中 ，; 
将 常量 “0000. . .000” 与 寄存 器 的 值 进行 异 或 ， 
观察 其 中 是 否 包含 '0” bit, 
如 果 结 果 为 真 ， 报 告 错误 ; 
否则 继续 进行 测试 
可 以 生成 类 似 的 小 测试 用 例 用 于 其 他 故障 。 不 幸 的 是 ， 处 理 器 为 main frames 
生成 的 诊断 程序 几乎 都 是 手动 生成 的 。 也 有 一 些 研究 者 致力 于 自动 诊断 程序 的 生成 
工作 [Brahme and Abraham, 1984], [ Krüger, 1986], [Bieker and Marwedel, 1995], 
[ Krstic and Dey, 2002], [ Kranitis et al. , 2003], [ Bernardi et al. , 2005], 


图 8.3 处理 器 硬件 分 割 


8.3 测试 模式 集 的 评估 以 及 系统 的 鲁 棒 性 


8.3.1 故障 覆盖 率 


测试 模式 集 质量 的 评估 可 以 以 故障 覆盖 率 作为 度量 标准 。 故障 覆盖 率 是 从 给 定 
的 测试 集中 包含 的 潜在 故障 的 百分比 。 

故障 覆盖 率 = 给 定 的 测试 集中 可 检测 的 故障 数量 /故障 模型 中 总 故障 数量 

实际 上 ， 若 想 生产 出 符合 质量 要 求 的 产品 ， 需要 保证 故障 覆盖 率 应 能 达到 至 少 
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98% ~99% 。 对 某 些 特定 系统 ， 需 要 更 高 的 覆盖 率 。 因 此 ， 对 于 某 些 特 定 的 硬件 组 
件 ， 就 需要 特定 的 故障 模型 (例如 电池 ) 。 

除了 达到 高 覆盖 率 外 ， 也 必须 保证 高 正确 覆盖 率 ， 这 意味 着 无 故障 的 系统 必须 
达到 上 述 两 种 要 求 ， 否 则 必须 保证 系统 的 故障 覆盖 率 达 到 100% 。 

为 了 增加 系统 验证 时 可 用 的 选项 数量 ， 应 该 在 系统 设计 阶段 就 提出 具体 的 测试 
方法 。 例 如 ， 可 以 在 系统 的 软件 模型 中 使 用 测试 用 例 集 ， 用 于 检测 两 种 软件 模型 的 
行为 是 否 一 致 。 系 统 如 果 使 用 形式 化 的 验证 方法 用 于 此 种 案例 中 将 耗费 更 长 的 
时 间 。 


8.3.2 故障 仿真 


完全 预测 系统 现存 的 故障 或 通过 分 析 计 算 覆 盖 率 是 几乎 无 法 完成 的 〈 可 以 预 
见 的 未 来 也 无 法 完成 ) 。 因 此 ， 对 系统 当前 故障 行为 的 预测 ， 通 常 通过 仿真 进行 。 
这 种 仿真 的 方式 称 作 故障 仿真 。 在 进行 故障 仿真 时 ， 系 统 模型 应 修改 为 反映 系统 当 
前 存在 的 某 种 故障 的 行为 。 

故障 仿真 的 目标 包括 : 

1) 了 解 该 组 件 的 故障 在 系统 级 别 的 影响 。 如 果 故 障 不 影响 系统 的 可 观察 行 
为 ,我们 就 称 该 故障 是 元 余 的 。 

2) 了 解 提 高 容错 的 机 制 是 否 对 系统 有 任何 帮助 。 

故障 仿真 需要 对 系统 中 所 有 故障 模型 进行 可 能 的 故障 仿真 ， 并 且 可 能 使 用 大 量 
的 、 不 同 的 测试 用 例 用 于 输入 。 因 此 ， 故 障 仿真 是 一 个 非常 耗 时 的 过 程 。 通 过 使 用 
不 同 的 技术 可 以 提高 故障 仿真 的 效率 。 

有 一 种 类 似 技 术 用 于 进行 门 级 别 的 故障 仿真 。 在 这 种 情况 下 ， 内 部 的 信号 都 是 
单一 的 比特 信号 。 这 样 就 可 以 将 信号 映射 至 仿真 的 宿主 机 某 一 机 器 字 的 某 个 比特 
中 。 与 和 或 的 机 器 指令 也 可 用 于 模拟 布尔 网 络 ， 然 而 每 个 机 器 字 中 可 能 只 有 一 个 比 
寺 位 使 用 ， 这 意味 着 要 提高 并 发 故障 仿真 的 效率 。 在 并 发 故障 仿真 中 ， 如 果 n 等 于 
机 器 字 的 长 度 ， 同 一 时 刻 有 个 不 同 测试 用 例 用 于 仿真 。n 个 测试 用 例 被 映射 至 该 
机 器 字 的 不 同比 特 中 ， 执 行 一 组 相同 的 与 、 或 指令 将 会 模拟 有 个 测试 用 例 的 布尔 
网 络 的 行为 。 


8.3.3 故障 输入 


对 于 实际 的 物理 系统 来 说 ， 进 行 故障 仿真 需要 耗费 大 量 的 时 间 。 如 果 有 可 用 的 
实际 系统 ， 就 可 以 使 用 故障 输入 替代 故障 仿真 。 故 障 输入 不 依赖 于 故障 模型 ( 尽 
管 可 以 使 用 这 些 模型 ) ， 因 此 故障 的 输入 有 可 能 在 不 能 进行 故障 预测 的 故障 模型 中 
导致 故障 的 产生 。 

可 以 区 分 如 下 两 种 类 型 的 故障 输入 : 

1) 系统 的 局 部 故障 。 
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2) 环境 故障 (与 系统 规格 需求 不 相符 的 行为 )。 例如， 可 以 检测 当 指 定 的 温 
度 或 辐射 强度 超出 范围 时 的 系统 行为 。 

可 以 用 于 故障 输入 的 若干 模型 如 下 

1) 在 硬件 级 别 的 故障 输入 : 示例 包括 硬件 引 脚 操 作 、 电 磁 以 及 核 辐射 。 

2) 在 软件 级 别 的 故障 输入 : 例如 对 某 些 内 存 比 特 位 的 触发 。 

故障 输入 的 质量 基于 “ 探 针 效果 ”: 探 针 有 可 能 会 影响 到 系统 的 行为 。 这 些 影 
响应 当 越 小 越 好 ， 本 质 上 应 该 是 可 以 忽略 的 。 

根据 Kopetz [ Kopetz, 1997] 的 实验 报告 ， 基于 软件 的 故障 输入 本 质 上 与 基于 
硬件 的 故障 输入 一 样 有 效 。 但 核 辐射 是 一 个 明显 的 例外 ， 因 为 生成 此 类 错误 的 方法 
与 生成 其 他 错误 的 方法 有 着 本 质 的 不 同 。 


8.4 可 测试 性 设计 


8.4.1 动机 


在 8.2. 1 节 已 经 提出 了 设计 逻辑 电路 测试 用 例 的 思路 。 对 于 电路 实现 状态 机 而 
言 《 自 动机 ) ， 测 试用 例 的 生成 会 更 加 困难 。 检 测 两 个 有 限 状 态 机 模型 是 否 等 价 ， 
需要 非常 复杂 的 输入 序列 【Kohavi，1987] 。 例 如 ， 考 虑 图 2. 27 所 示 的 状态 表 ， 为 
了 方便 起 见 ， 再 次 在 图 8. 4 中 复 现 。 


fa 
EOLO 
k 


图 8.4 用 于 测试 的 有 限 状 态 机 

















假设 要 测试 状态 C 到 状态 D 的 过 渡 ， 通 过 执行 适当 的 输入 序列 ， 首 先 获得 状 
态 C。 接 下 来 ， 必 须 生成 输入 事件 i， 如 果 生 成 了 输出 y， 则 需要 对 其 进行 检测 。 另 
外 ， 还 需要 检测 是 否 达 到 了 状态 D。 这 个 过 程 相当 复杂 ， 并 且 容 易 受 到 其 他 错误 的 
影响 2 。 

该 示例 证 明 : 如 果 只 对 系统 输出 进行 测试 ， 那 么 对 系统 的 测试 将 会 变 得 非常 困 
难 。 为 了 简化 测试 ， 可 以 添加 特殊 的 硬件 使 得 测试 变 得 更 加 简单 。 用 于 简化 测试 的 
设计 过 程 ， 成 为 可 测试 性 设计 (Desigh for Testability，DfT) 。 用 于 测试 有 限 状 态 机 
的 特殊 硬件 就 是 一 个 典型 的 示例 。 





< 有 限 状 态 机 测试 的 简化 原因 是 有 限 状 态 机 中 包含 了 对 线性 链 的 转换 (在 本 章 的 思考 题 中 有 相关 内 容 ) 
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8.4.2 扫描 设计 

通过 使 用 扫描 设计 ， 可 以 简化 将 用 例 输 入 程序 ， 达 到 某 一 特定 状态 ， 并 对 该 状 
态 结果 进行 观测 。 在 扫描 设计 时 ， 可 以 将 触发 器 中 存储 的 状态 连接 至 一 个 串 行 移 位 
寄存 器 中 ( 见 图 8.5) 。 


























4 
DFF 
: 3 r> 
X Z 
4 3 D -_o 
= 串 行 输出 
gq 1 
< 并 DFF 
as gis 
XQ AL 1 ia ua 证 Ae 
Zo 
‘ DFF 
se Ci| 
区 Zi 0 i 


























] 
me 时 钟 
普通 模式 /测试 模式 


图 8.5 扫描 路 径 设 计 


电路 中 包含 3 个 DD 触发 器 ， 并 且 在 每 个 触发 器 的 输入 端 都 包含 了 一 个 数据 选 
择 器 。 通 过 控制 该 数据 选择 器 的 输入 (在 最 底部 显示 了 数据 选择 器 的 输入 ) ， 既 可 
以 连接 至 基于 当前 输入 和 当前 状态 所 生成 的 下 一 个 状态 的 触发 器 网 络 ， 也 可 以 将 触 
发 器 连接 至 一 个 串 行 链 中 。 通 过 将 数据 选择 器 设置 为 扫描 模式 ， 可 以 在 状态 位 进入 
扫描 链 后 ， 再 载 人 该 状态 位 〈 每 个 时 钟 周期 1bit) 。 

这 样 ， 就 可 以 将 任意 的 状态 位 顺序 下 载 至 3 个 触发 器 中 。 在 第 二 个 阶段 ， 当 数 
据 选择 器 处 于 普通 模式 时 ， 可 以 在 有 限 状 态 机 中 使 用 一 个 输入 用 例 。 在 下 一 个 时 钟 
滴答 ， 有 限 状态 机 将 转变 状态 。 新 的 状态 在 第 三 及 最 终 阶段 会 被 连续 移出 ， 并 且 会 
再 次 使 用 串 行 模式 〈 每 个 时 钟 1bit) 。 人 们 并 不 关心 如 何 达到 某 一 状态 以 及 如 何 观 
察 布 尔 函 数 5 的 下 一 个 状态 是 否 正确 地 实现 了 对 有 限 状 态 机 的 测试 。 实 际 上 ， 处 理 
的 基于 状态 的 系统 所 影响 的 只 有 两 个 (简单 的 ) 阶段 ， 以 及 无 状态 的 测试 用 例 。 
布尔 网 络 可 以 用 于 检测 输出 的 正确 性 。 

扫描 设计 技术 在 单 芯片 的 场景 下 运行 良好 。 对 于 板 级 集成 来 说 ， 需 要 某 些 技术 
连接 若干 个 芯片 的 扫描 链 。JTAG 是 用 于 处 理 该 场景 的 标准 。JTAG 标准 定义 了 所 有 
芯片 的 边界 寄存 器 以 及 测试 引 脚 的 数量 ， 另 外 还 定义 了 将 所 有 芯片 连接 至 扫描 链 的 
控制 命令 。JTAG 也 被 称 作 边 界 扫描 [Parker, 1992], 
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8. 4.3 特征 分 析 
为 了 避免 将 DUT 的 响应 移出 ， 可 以 将 响应 进行 压缩 。 可 以 使 用 图 8 6 所 示 的 


计划 : 
Test pattern A Response Comparison 
generation compaction with reference 
图 8.6 Xf DUT 进行 测试 


生成 的 测试 用 例 用 于 DUT 的 输入 (或 称 为 激励 ) DUT 的 响应 被 压缩 形成 为 
一 个 代表 响应 的 信和 号 。 该 响应 会 与 预期 的 响应 进行 对 比 ， 可 以 通过 仿真 计算 得 出 预 
期 响应 。 

压缩 通常 通过 线性 反馈 移 位 寄存 器 ( Linear Feedback Shift Registers, LFSR) jz 
行 ， 该 移 位 寄存 器 使 用 异 或 反馈 。 图 8.7 显示 了 一 个 4bit 的 LFSR (ÆR) 以 及 其 
相关 的 状态 图 (AR) [Lala, 1985], 




















图 8.7 用 于 响应 压缩 的 线性 反馈 寄存 器 


虚线 表示 输入 为 '1' ， 实 线 表示 输入 为 '0，。 选择 的 反馈 产生 所 有 可 能 的 
特征 。 

在 测试 时 ， 系 统 测试 的 响应 被 发 送 至 LFSR 的 输入 中 。LFSR 接 下 来 会 生成 
反映 响应 的 信号 。 由 于 使 用 存储 的 信号 替代 所 有 的 响应 ， 有 些 响 应 的 类 型 可 以 
被 映射 至 同样 的 信号 中 。 那么 从 不 正确 的 响应 中 获取 正确 的 信号 的 概率 会 是 
多 少 ? 

总 之 ,一 个 有 nbit 的 信号 发 生 器 可 以 生成 2" 个 信和 号。 对 于 DUT 的 mbit 的 响 
应 ， 可 以 将 2 " ”个 响应 均匀 映射 至 相同 的 信号 中 。 假设 预期 的 某 一 信号 用 于 系统 
的 正确 响应 ， 接 下 来 ， 2”-" -1 个 不 正确 的 响应 也 会 映射 至 相同 的 信号 中 。 如 果 
响应 有 mbit， 那 么 不 正确 的 响应 总 数 为 2" -1。 因 此， 将 不 正确 的 响应 映射 至 正确 
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的 信号 (提供 到 信号 的 均匀 模式 映射 ) 中 的 概率 为 





/映射 至 相同 信号 的 模型 
P = Pr( TRE Ea | en) 
1 

2-1 (8.2) 
Noh 

=>; (8.3) 


此 时 m >> n, 

这 意味 着 如 果 移 位 寄存 器 足够 长 ， 从 不 正确 的 测试 响应 中 生成 正确 的 信和 号 的 概 
率 是 非常 小 的 。 
8.4.4 伪 随 机 测试 模式 生成 

对 于 使 用 大 量 触发 器 的 芯片 ， 需 要 大 量 的 时 间 进 行 测 试用 例 的 移动 。 为 了 
加 快 芯片 生成 测试 用 例 的 时 间 ， 通 常会 将 生成 测试 用 例 的 硬件 也 集成 至 芯 
片 中 。 

例如 ， 伪 随机 模式 (依然 是 由 LFSR 生成 ) 也 可 用 于 测试 模型 中 。 例 如 可 以 将 
图 8.7 所 示 电 路 改 为 图 8. 8 所 示 。 

4bit 移 位 寄存 器 


时 钟 一 也 






























(1001) 0110 1101 1010 0101 


图 8. 8 用 于 生成 测试 用 例 的 线性 反馈 移 位 寄存 器 

该 电路 会 生成 所 有 除了 由 全 0 组 成 用 例外 的 测试 用 例 。 由 于 生成 器 一 旦 到 达 全 
0 的 状态 时 会 被 阻塞 ， 所 以 必须 避 开 全 0 状态 。 这 种 生成 的 模型 在 运行 被 测 系统 时 
的 效果 优 于 单 计数 器 系统 。 
8.4.5 内置 逻 辑 块 观测 

内 置 逻 辑 块 观测 ( Built-In Logic Block Observer, BILBO) [ Könemann et al. , 
1979] 推荐 用 于 电路 合并 测试 用 例 生成 ， 用 于 测试 密封 响应 以 及 连续 功能 扫描 。 
如 图 8.9 所 示 ， 每 个 BILBO 使 用 3 个 D 触发 器 。 
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串 行 输出 
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图 8. 10 显示 了 BILBO 的 寄存 器 模式 。 图 8.9 BRAN AY 3bit 寄存 器 可 以 用 于 通道 
扫描 、 复 位 、 线 性 反 馈 移 位 寄存 器 (Linear- Feedback Shift Register, LFSR) 以 及 普 
通 模式 。 在 LFSR 模式 中 ， 该 寄存 器 可 以 用 于 生成 伪 随 机 模式 或 对 输入 (Z ~ ~Z,) 
进行 响应 压缩 。 在 这 种 情况 下 ， 压缩 就 会 基于 并 行 输入 而 非 之 前 所 提 到 的 串 行 输 
人。 使 用 并 行 输入 进行 压缩 的 目的 及 行为 与 使 用 串 行 输入 的 目的 是 一 致 的 。 
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Al 8.9 BILBO 
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图 8.10 BILBO 的 寄存 器 模式 


特别 说 明 的 是 ，BILBO 通常 成 对 使 用 ( 见 图 8. 11)。 

一 个 BILBO 会 生成 一 个 伪 随 机 测试 用 例 ， 并 将 这 些 用 例 输入 至 布尔 网 络 中 。 
布尔 网 络 的 响应 会 被 链接 到 该 网 络 输出 的 第 二 个 BILBO 进行 压缩 。 在 测试 序列 的 
最 后 ， 被 压缩 的 响应 会 被 连续 移出 并 且 与 预期 的 响应 进行 对 比 。 预 期 的 相应 可 以 通 
过 仿真 进行 计算 得 出 。 
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图 8.11 交叉 耦合 的 BILBO 
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在 第 二 个 阶段 ， 两 个 BILBO 的 用 途 可 以 互 换 。 在 该 阶段 ， 使 用 图 8. 11 所 示 的 
虚线 部 分 表示 。 在 普通 模式 中 ，BILBO 可 以 用 作 状 态 寄存 器 。 

DET 硬件 模块 在 进行 硬件 原型 设计 以 及 调试 中 起 到 了 重要 的 帮助 作用 。 由 于 硬 
件 设备 绝 不 会 有 0 缺陷 率 ， 所 以 在 最 后 的 产品 中 使 用 DET 硬件 也 有 其 重要 意义 。 使 
用 此 类 在 硬件 制造 时 进行 测试 的 工具 ， 以 降低 整个 产品 的 支出 被 所 有 的 公司 所 
青睐 。 


8.5 思考 题 


1. 考虑 如 图 8.2 所 示 的 电路 ， 在 信号 h 中 生成 一 个 故障 0 错误 的 测试 用 例 。 
2. 哪个 状态 图 与 图 8. 12 所 示 的 LFSR 相符 ? ee 
3. 对 图 8.4 所 示 的 FSM， 指 定 其 测试 用 例 以 及 预 
期 的 相应 。 这 些 用 例 必须 被 指定 为 一 系列 成 对 的 序列 
(测试 用 例 、 预 期 响应 ) 。 图 8.4 所 示 的 事件 可 以 用 作 
测 斌 用例。 假设 FSM 在 上 电 后 处 于 默认 状态 ， 提 供 一 
个 针对 所 有 转移 的 完整 测试 ! 注意 ， 特 殊 的 FSM 链 结 
构 可 以 简化 测试 。 rene 











附 录 


MRA 整数 线性 规划 


整数 线性 规划 (Integer Linear Programming, ILP) 是 一 种 数学 化 的 优化 技术 ， 
它 可 以 用 于 解决 大 量 的 工程 优化 问题 。 

ILP 提供 了 一 种 比较 通用 的 优化 问题 建 模 方式 。ILP 模型 包含 两 部 分 内 容 : 一 
个 成 本 函数 (Cost Function) 以 及 一 个 约束 集 (Set of Constraints) 。 这 两 部 分 都 会 
引用 到 以 整数 值 为 变量 的 集合 = 1z | 。 成 本 函数 必须 是 这 些 变 量 的 线性 函数 ， 
因此 它们 可 以 表示 为 如 下 形式 : 


C= 3, ax, (A.1) 
式 中 Qi E IR; 
x; EINoo 
约束 集 也 必须 是 包含 整数 变量 的 线性 函数 ， 可 以 表示 为 如 下 形式 ， 
Viet: $, 0 和 6 (A.2) 


式 中 b; jx c EIR, 
定义 : 问题 是 在 式 〈A. 2) 给 出 的 约束 条 件 下 寻找 式 (A.1) 的 极 小 化 成 本 函数 。 
如 果 所 有 的 变量 被 约束 为 0 或 者 1， 则 相应 的 模型 被 称 为 0/1 整数 线性 规划 模型 
(0/1- Integer Linear Programming Model ) 。 在 这 种 情况 下 ， 变 量 仍然 表示 的 是 (二 进 
制 ) 决策 变量 。 

如 果 约 束 bi, j 作出 相应 的 修改 ， 则 式 (A. 2) 中 的 = 可 以 替代 为 二。 如 果 在 
A (A.2) 中 的 非 负 变 量 前 均 乘 以 -1， 则 也 可 以 使 用 负 整 数 x，( 即 x, 可 以 是 任何 
整数 值 ) 。 对 于 求 某 些 增益 函数 C' 极 大 值 的 情况 ， 可 以 设置 C= -C'。 

举例 ， 假 定 x). x, 和 x, 均 为 整数 ， 下 式 表示 了 一 个 071IP 模型 ， 

由 于 约束 集 的 要 求 ， 所 有 变量 只 能 为 0 或 1。 在 图 A.1 列 出 了 4 种 解法 ， 成 本 
为 9 的 解法 是 最 优 的 。 


C =5x, +6x +4x, (A.3) 
Xi + Ny +x, 2 (A.4) 
wl ( A. 5) 

% <1 (A.6) 


x <1 (A.7) 
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ILP 是 线性 规划 的 一 种 变异 。 对 于 线性 规划 ， C 
其 变量 可 以 是 任何 实数 值 。 使 用 数学 化 的 方法 ， 
ILP 与 LP 模型 都 可 以 用 于 去 解决 一 些 优化 问题 。 但 I 
PENE, ILP 是 NP 完全 ( NP- Complete) 的 (LP 15 | 














不 是 ) ， 同 时 ILP 的 执行 次 数 可 能 会 非常 庞大 。 图 A.1 上 述 ILP 问题 的 可 能 解法 

然而 ， 如 果 模 型 不 是 特别 庞大 ， 则 ILP 模型 在 
对 优化 问题 的 建 模 上 就 非常 有 效 。 在 对 整数 线性 规划 问题 进行 优化 建 模 时 ， 可 以 忽 
略 问题 的 复杂 度 : 许多 问题 都 可 以 在 可 接受 的 时 间 内 人 解决， 如果 不 能 ， 则 ILP 模型 
仍然 能 作为 解决 问题 的 一 个 起 点 。ILP 的 执行 时 间 依 赖 于 变量 的 数量 ， 以 及 约束 集 
的 数量 与 结构 。 一 些 好 的 ILP 算法 (如 Ip_solve [ Anonymous, 2010a] 或 CPLEX) 
可 以 在 可 接受 的 时 间 内 (如 数 分 钟 ) 解决 包含 数 千 个 变量 的 结构 良好 的 问题 。 关 
于 ILP 与 LP 的 更 多 资料 ， 可 以 参考 某 些 著作 的 相关 章节 (如 Wolsey [ Wolsey, 
1998] ) 。 


附录 B 基 尔 霍 夫 定律 与 运算 放大 器 


在 3.6.1 节 对 D-A 转换 器 的 讲述 中 ， 也 涉及 了 关于 运算 放大 器 的 基本 原理 。 
通常 计算 机 科学 专业 的 学 生 都 比较 缺乏 对 这 方面 知识 的 了 解 ， 因 此 在 本 书 的 附录 B 
中 有 必要 将 这 些 基 本 知识 再 重新 阐述 一 下 。 由 于 理解 运算 放大 器 的 基本 知识 需要 用 
到 基 尔 霍 夫 定律 Kirchhoff? s Laws) ， 所 以 也 在 附录 B 中 对 其 进行 介绍 。 

1. 基 尔 霍 夫 定 律 

















基 尔 霍 夫 定律 是 一 种 电路 分 析 的 方法 。 第 一 条 定 Ji 
律 是 基 尔 霍 夫 电流 定律 ， 也 称 作 基 尔 霍 夫 节点 定律 或 p p i 
基 尔 霍 夫 第 一 定律 。 使 用 图 B. 1 中 的 节点 来 解释 这 一 “全 一 m= 
定律 。 Ji 


IRIE: 在 电路 中 的 任 一 节点 ， RA MBI supe ane 
此 市 点 的 电流 和 与 流出 此 节点 的 电流 和 相等 Jewett 
and Serway，2007 ] 。 对 于 电路 中 的 任 一 节点 有 
Y=0 (B.1) 
FZI 〈B. 1) 来 使 用 基 尔 霍 夫 定律 ， 将 流出 节点 的 电流 用 从 节点 指向 远 处 的 箭 
头 表 示 ， 同 时 计 为 负 值 ， 这 种 计算 的 方法 其 实 与 电子 的 真正 流向 没有 关系 。 
如 对 于 当前 的 图 B. 1 有 





i +i, -i +1, =0 (B. 2) 
h +i, +i, =1, (B. 3) 


由 于 电荷 在 转换 中 的 守恒 ， 才 产生 了 这 一 定律 。 如 果 没 有 这 一 定律 ， 则 电荷 数 
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将 不 再 为 常量 ， 而 电压 也 将 不 断 下 降 。 
基 尔 霍 夫 的 第 二 个 定律 应 用 在 电路 回路 中 ， 也 被 称 为 基 尔 震 夫 电压 定律 或 基 尔 
霍 夫 回路 定律 ， 或 基 尔 霍 夫 第 二 定律 。 图 B. 2 展示 了 一 个 例子 。 


基 尔 霍 夫 电 压 定律 :对 于 一 个 闭合 回路 ， 在 任何 时 v, 
刻 沿 该 回路 的 电压 代数 和 等 于 零 [Jewett and Serway， 
2007]。 对 于 电路 中 的 任 一 回路 有 B Rs 
vS Rll ly, 
> v, =0 (B. 4) i 
如 果 电 压 的 方向 与 箭头 的 方向 相反 ， 则 将 电压 计 为 Te 
负 值 。 如 对 于 图 B. 2 中 的 电路 有 
V, -V, - V, +V, =0 (B.5) HB. 2 eB 


这 种 不 变性 的 根本 原因 是 能 量 的 转换 本 质 。 如 果 没有 这 一 定律 ， 则 在 电路 回路 
中 增添 电荷 ， 也 可 以 不 计较 能 量 的 损耗 。 

通常 ， 电 子 真正 流动 的 方向 以 及 两 个 端点 之 间 的 相对 方向 并 不 重要 。 上 述 图 中 
的 方向 可 以 随意 选择 ， 只 需要 保证 在 应 用 基 尔 霍 夫 定律 时 ， 使 用 的 箭头 方向 遵从 了 
这 一 定律 即 可 。 如 果 箭 头 所 表示 的 加 在 元 器 件 上 的 电压 与 流 过 元 器 件 的 电流 方向 相 
反 ， 则 在 公式 中 就 需要 重新 考虑 此 元 器 件 。 例 如 ， 对 于 电压 与 电流 方向 相反 的 情 
Oi, WATER B. 2 中 对 R, 使 用 欧姆 定律 (Ohms Law) : 

V; 


Le (B. 6) 
3 R, 
当然 ， 通 常 都 会 将 电压 与 电流 的 方向 定义 为 一 致 ， 从 而 不 必 过 多 地 去 考虑 计算 
中 的 符号 问题 。 
2. 运算 放大 器 


在 某 些 场合 ， 通 常 需要 将 一 个 信号 x(1) 放大 ， 从 而 得 到 另 一 个 当 w >1 时 的 
fa S y(t) =a…x(i) ， 其 中 被 称 为 增益 (Gain) 。 如 果真 为 不 同 的 增益 来 设计 不 
同 的 电路 ， 那 会 是 一 项 非常 艰苦 的 工作 ， 因此 工程 师 通 常 使 用 比较 容易 配置 的 放大 
器 来 得 到 所 需 增 益 。 这 些 放大 器 即 被 称 为 运算 放大 器 (Operational Amplifier) ,或 
者 简写 为 op- amp。op-amp 也 可 以 用 于 非常 宽 的 增益 需求 范围 。 在 实际 中 只 需要 修 
改 电 路 上 op- amp 周边 的 一 些 硬件 元 器 件 ， 就 可 以 得 到 不 同 的 增益 。 

通常 ， 运 算 放 大 器 都 有 两 个 信号 输入 端 A ee 
一 个 信和 号 输出 端 ， 有 两 个 供电 电源 〈 见 图 
B:-3)a 

op- amp 使 用 增益 g, 以 地 为 参考 来 放大 
两 个 输入 信号 之 间 的 电压 差 : 

Veg he th, =F) (B.7) 

g 被 称 为 开 环 增益 (Open Loop Gain) , 图 B.3 运算 放大 器 





ground 
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通常 g 的 值 会 非常 大 (10* <g <10°), XFW op-amp, g 可 以 认为 是 无 穷 大 的 。 
通常 op- amp 还 会 有 非常 大 的 输入 阻抗 ( > 1MQ) ， 因 此 可 以 忽略 信和 号 的 输入 电流 。 
对 于 理想 运算 放大 器 ， 其 输入 阻抗 是 无 穷 大 的 ， 而 输入 电流 为 零 。 

op- amp 在 几 十 年 前 就 已 经 商业 化 了 ， 它 们 一 些 是 分 立 的 集成 电路 ， 另 一 些 被 
集成 到 其 他 电路 中 。op-amp 的 区 别 往 往 在 于 它们 的 转换 速率 、 电 压 范围 、 电 流 驱 
动能 力 以 及 其 他 一 些 特性 。op- amp 的 实际 电路 增益 通常 是 通过 选择 外 部 电阻 来 实 
现 的 。 图 B. 4 展示 了 一 个 运算 放大 器 的 电路 。 








图 B.4 带 反 馈 的 运算 放大 器 


两 个 输入 信和 号 之 间 的 任何 微小 的 电压 差 ， 都 将 被 乘 以 一 个 非常 大 的 放大 因子 。 
输出 结果 电压 通过 电阻 R, 反馈 到 了 运算 放大 器 的 反 向 输入 端 ， 因 此 当 了 _ 为 正 电 压 
时 ，V, 将 为 负电 压 ， 反 之 亦 然 。 也 就 是 说 因为 大 的 放大 率 ， 反馈 对 输入 电压 也 有 
了 强大 的 反作用 ， 它 会 减 小 输入 引 脚 上 的 电压 。 问 题 在 于 : 减 小 多 少 ? 使 用 基 尔 霍 
夫 定 律 可 以 计算 电压 中 (LAL B. 5)。 

基于 op- amp 的 特性 有 

Va = 7g. V (B. 8) 

将 基 尔 霍 夫 定律 应 用 在 图 B. 5 中 所 示 的 回路 上 有 





J” 


图 B.5 带 反 馈 的 运算 放大 器 〈 被 强调 的 回路 ) 





ground 





1-R,+V,,-V_ =0 (B.9) 

注意 ， 由 于 假定 的 电压 方向 与 箭头 方向 相反 ， 因 此 在 了 _ 的 前 面 加 上 了 负 号 。 
根据 式 〈B.8) 与 式 (B.9) 有 

I-R,+(-g) .7 -7 =0 (B. 10) 
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(l+g)+V_=I-R, (B. 11) 
I- R, 
ST (B. 12) 
i! 
V iial = lim l+g (B. 13 ) 
=0 (B. 14) 


这 就 是 说 ， 对 于 理想 op-amp，F 为 零 。 从 这 一 点 出 发 ， 反 向 信号 输入 端 也 被 
称 为 虚拟 地 (Virtual Ground) 。 但 是 这 一 输入 端 又 不 能 与 地 直接 相连 ， 因 为 这 会 
改变 输入 电流 。 

在 第 3 章 有 一 个 思考 题 ， 就 是 关于 类 似 图 B.4 中 的 实际 电压 增益 的 计算 。 
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